Appleとコロンビア大学の研究者が2023年10月に、あまり注目されずにオープンソースのマルチモーダル大規模言語モデル(LLM)「Ferret」をリリースしました。このリリースにはコードと重みが含まれていましたが、商用ライセンスは含まれておらず、研究目的のみでの使用が許可されていました。しかし、最近になってこのリリースに対する関心が高まっています。GoogleのGeminiモデルがPixel Proに導入され、将来的にはAndroidにも導入される予定であり、小型デバイスでのローカルLLMの可能性についての議論が活発になっているためです。AppleはiPhone上でLLMを展開するための重要なブレークスルーを達成したと発表し、3Dアバターと効率的な言語モデル推論のための新技術を紹介する2つの新しい研究論文をリリースしました。これらの進歩は、より没入感のある視覚体験を可能にし、iPhoneやiPadなどの消費者向けデバイスで複雑なAIシステムを実行することを可能にすると評価されています。AppleがオープンソースLLMの分野に参入したことは、Appleが従来「閉じた庭」として知られていたことから、AIコミュニティにとって意外な出来事でした。医療分野のオープンソースAIに焦点を当てたヨーロッパの非営利団体を運営するBart de Witte氏は、AppleがオープンソースAIコミュニティに参加したことを後から知り、Ferretの導入はAppleの影響力のあるAI研究へのコミットメントを示すものであり、マルチモーダルAI分野でのリーダーとしての地位を固めるものだと述べました。また、将来的にはローカルLLMがiOSの再設計されたサービスとしてiPhoneで動作する日を楽しみにしているとコメントしています。
このケースは単独のものではありません。2024年にJournal of Experimental Criminologyに発表された学術研究でも、Draft Oneを含むAI支援報告書作成システムが実際の時間短縮効果を示さなかったという結果が報告されています。これらの事実は、Axon社の主張と実際の効果に重要な乖離があることを示しています。
技術的には、長文脈での「needle in a haystack(干し草の山の中の針)」的検索・想起の正確性が論点です。Anthropicは内部評価で100%の再現性を謳いますが、これはあくまで社内テストであり、実運用におけるコード異臭検知や設計上のトレードオフ把握など、多層的な推論の持続性は現場検証が不可欠です。ただし、プロジェクト全体像を”丸ごと”見渡せること自体は、ファイル粒度の分割では失われがちだった依存関係と設計意図を保ったまま提案できる余地を広げます。