AI(人工知能)ニュース

ナレッジグラフの潜在力、データサイエンス界が注目

データサイエンス界では、ナレッジグラフへの関心が高まっています。この技術は情報検索を効率化しますが、多くのデータサイエンティストはその潜在能力を十分に活用していません。成功には、FAIR原則に基づくデータの整理と専門家との連携が必要です。2023年のレポートは、ナレッジグラフが質問応答の正確性を向上させることを確認しています。【用語解説とAIによる専門的コメントつき】

Published

on

【ダイジェスト】

データサイエンスコミュニティが最近、ナレッジグラフにより多くの関心を寄せていますが、データサイエンティストの一部は、ナレッジグラフの潜在能力の表面をかろうじて探っているに過ぎません。データサイエンティストが根本的な問題を建築的変革の観点から捉え、解決すべき問題の範囲を理解するまで、システム全体に利益をもたらす方法でナレッジグラフを設計・構築することはありません。公開ウェブからスクレイピングしたデータのラベリングは、根本的な建築的問題を解決しません。データサイエンティストは、ナレッジグラフにおいて、発見可能でアクセス可能で相互運用可能で再利用可能(FAIR)な方法で表現された知識を共有する理解の創出を支援するために、ナレッジアーキテクトやエンジニアと連携する必要があります。そうでなければ、ナレッジグラフの取り組みは、ほとんどのマスターデータ管理の努力が失敗したのと同じ運命をたどります。

2023年11月、data.worldとMetaからのベンチマークレポートが、質問応答の正確性を向上させるためにナレッジグラフなどのセマンティック技術が必要であることを確認しました。data.worldの結果レポートによると、SQLデータベースへのGPT-4のゼロショットプロンプトは16%の正確性であったのに対し、それらのSQL DBのKG表現への同じGPT-4のプロンプトは54%の正確性を達成しました。一方、Metaは、人間が質問に92%の正確性で答えることができるのに対し、プラグインを備えたGPT-4は15%の正確性であったと報告しました。

2023年11月16日、統計学教授のMark Handcockが「データサイエンスにおけるナレッジグラフ」というテーマでUCLAのデータ理論シリーズの第三回セミナーをモデレートしました。このセミナーは有益でしたが、ナレッジグラフが単一の、おそらく人手不足のアドホックプロジェクトを超えて何ができるかについては触れませんでした。SnapとMicrosoftでデータサイエンスの役割を持つ2人の博士が、公共/民間エンティティのマッチングとCOVID研究のナレッジグラフ構築の取り組みについて話しました。カリフォルニア大学ロサンゼルス校(UCLA)は、データ理論を専攻として提供していることが珍しいです。データは、機械学習の正確性が完全にデータ入力の品質と包括性に依存していることを考えると、独自の研究分野であるに値します。

【ニュース解説】

データサイエンスの分野では、最近ナレッジグラフに対する関心が高まっています。ナレッジグラフは、データ間の関係性を明確に表現することで、情報の検索や活用を効率的に行うための技術です。しかし、多くのデータサイエンティストがこの技術の表面的な理解に留まり、その潜在的な可能性を十分に引き出していないという問題が指摘されています。

ナレッジグラフを効果的に活用するためには、単に公開ウェブから収集したデータをラベリングするだけでは不十分です。根本的な建築的変革を視野に入れ、データを発見可能でアクセス可能、相互運用可能、再利用可能(FAIR)な形で整理し、共有する必要があります。これを実現するためには、ナレッジアーキテクトやエンジニアといった、ナレッジグラフの構築と接続に精通した専門家との連携が不可欠です。

また、ナレッジグラフの取り組みを成功させるためには、企業のリーダーシップが重要な役割を果たします。ナレッジアーキテクトやエンジニアに実権と長期的なコミットメントを与え、ナレッジグラフインフラの構築と利用を推進することが求められます。

2023年11月のベンチマークレポートでは、ナレッジグラフが質問応答の正確性を向上させるために重要であることが確認されました。SQLデータベースに対するGPT-4のプロンプトは16%の正確性であったのに対し、ナレッジグラフ表現を用いた場合は54%の正確性を達成しました。これは、ナレッジグラフがデータの関係性を豊かに表現し、より正確な情報提供を可能にすることを示しています。

しかし、ナレッジグラフの潜在能力を最大限に引き出すためには、データサイエンスの教育や研究においても、この技術の重要性をより深く理解し、推進する必要があります。データの品質や包括性が機械学習の正確性に直結する現代において、ナレッジグラフはデータサイエンスの未来を形作る重要な鍵となるでしょう。

from What data scientists overlook when it comes to knowledge graphs.

Trending

モバイルバージョンを終了