Inflection AIは、DeepMindの共同創設者Mustafa SuleymanとLinkedInの共同創設者Reid Hoffmanによって設立されたパロアルトに拠点を置くスタートアップである。同社は新しい基盤モデル「Inflection-2.5」を発表した。このモデルは、これまでの作業を基にしており、同社の元のモデル「Inflection-1」を大幅に上回り、特にSTEM(科学、技術、工学、数学)の分野でOpenAIのGPT-4モデルに匹敵する性能を示している。Inflection-2.5は、同社のPiアシスタントを動かすために開発され、モバイルおよびウェブ経由でテストが可能である。
Inflection AIは、他のモデル、特にGPTシリーズよりも個人的で親しみやすいAIを構築することを目指しており、Piの背後にあるモデルに独自の共感的な微調整を施し、特徴的な個性と優れたEQ(感情指数)を与えた。新たにアップグレードされたInflection 2.5により、物理学や数学などの分野を含むIQ(知能指数)の側面が強化された。同社によると、Inflection-2.5を搭載したPiとの会話では、趣味の話からコーディング、生物学の答えの確認、ビジネスプランの作成まで、幅広いトピックを扱うことができる。
性能のベンチマークにおいて、アップグレードされたモデルはInflection 1に比べて全体的に大幅な改善を示し、GPT-4に迫るものの、まだ及ばない。例えば、MMLUベンチマークでは、Inflection-2.5は85.5をスコアし、GPT-4の87.3に僅かに後れを取った。STEM試験では、ハンガリー数学試験で63(GPT-4は68)、物理学GREで85パーセンタイル(GPT-4は97パーセンタイル)を記録した。GSM8Kベンチマークでは、Inflectionモデルは86.3をスコアし、GPT-4の92に対して成績を示した。
Inflection AIは、この「GPT-4レベルの94%の性能」を、OpenAIの大規模言語モデル(LLM)のために行われたトレーニングよりもはるかに効率的なトレーニングで達成したと指摘している。具体的には、Inflection-2.5はGPT-4のトレーニングに必要なFLOPs(計算)の40%でこれらの結果を得た。また、GPT-4と同様に、このモデルもリアルタイムのウェブ検索機能を組み込んでおり、最新の情報をユーザーに提供する。現在、PiチャットボットはAndroid、iOS、ウェブ、デスクトップアプリケーションで利用可能であり、1日あたり100万人、月間600万人のアクティブユーザーを持ち、平均会話時間は33分である。
【ニュース解説】
Inflection AIは、DeepMindの共同創設者であるMustafa SuleymanとLinkedInの共同創設者であるReid Hoffmanによって設立されたパロアルトに拠点を置くスタートアップです。この企業が開発した新しい基盤モデル「Inflection-2.5」は、特に科学、技術、工学、数学(STEM)の分野で、OpenAIのGPT-4モデルに匹敵する性能を示しています。このモデルは、同社のPiアシスタントを動かすために開発され、モバイルおよびウェブ経由でテストが可能です。
Inflection AIは、他のモデル、特にGPTシリーズよりも個人的で親しみやすいAIを構築することを目指しています。Piの背後にあるモデルには独自の共感的な微調整が施され、特徴的な個性と優れた感情指数(EQ)を与えられています。新たにアップグレードされたInflection 2.5により、物理学や数学などの分野を含む知能指数(IQ)の側面が強化されました。これにより、ユーザーはPiとの会話で、趣味の話からコーディング、生物学の答えの確認、ビジネスプランの作成まで、幅広いトピックを扱うことができます。
性能のベンチマークにおいて、アップグレードされたモデルはInflection 1に比べて全体的に大幅な改善を示し、GPT-4に迫るものの、まだ及ばないという結果が出ています。しかし、Inflection AIは、この「GPT-4レベルの94%の性能」を、OpenAIの大規模言語モデル(LLM)のために行われたトレーニングよりもはるかに効率的なトレーニングで達成したと指摘しています。これは、同等の性能をより少ない計算資源で達成できることを意味し、AI技術の発展において重要な進歩です。
また、GPT-4と同様に、このモデルもリアルタイムのウェブ検索機能を組み込んでおり、最新の情報をユーザーに提供することができます。これは、特に現在の出来事に関する情報を求めるユーザーにとって大きな利点です。
この技術のポジティブな側面としては、より人間らしい対話が可能になること、特定の専門分野での高い性能、そして効率的なトレーニングによる環境への影響の軽減が挙げられます。一方で、潜在的なリスクとしては、AIによる情報の誤解釈や、プライバシーに関する懸念があります。また、このような高度なAI技術の発展は、規制や倫理的なガイドラインの必要性を高めることも予想されます。
将来的には、このようなAIモデルの進化が、教育、研究、ビジネスプランニングなど、さまざまな分野での応用をさらに拡大することが期待されます。また、AI技術の発展は、人間とAIの関係を再定義し、私たちの生活や働き方に革命をもたらす可能性があります。
from Inflection AI launches new model for Pi chatbot, nearly matches GPT-4 .