AstraZenecaのR&DリードであるBen Gardnerは、データ共有のFAIR(Findable, Accessible, Interoperable, Reusable:発見可能、アクセス可能、相互運用可能、再利用可能)原則を研究開発文化において拡大するための取り組みについて語った。Gardnerは、過去6年間AstraZenecaで学んだこととして、チーム全員がウェブオントロジー言語(OWL)、グラフ思考、ウェブセマンティクスにすぐに取り組むことを期待しないことの重要性を強調している。彼は、これらの概念と方法をセマンティックインフラストラクチャの下に置くことを提案している。
FAIRデータの自動化能力は強力であるが、広範な採用には、新しいツール、思考、ワークフローの変更を大量に必要としない段階的な変更が鍵となる。そのため、AstraZenecaのR&Dチームでは、Snowflakeを介して共有されるフラットテーブルを介して共有および更新される制御された語彙を通じてデータ品質を向上させることに焦点を当てている。制御された語彙には、Simple Knowledge Organization System eXtension for Labels(SKOS-XL)が使用されている。SKOSは、OWLおよびその他のW3Cセマンティックスタックと互換性のある、広く使用されているサポートされたW3C標準である。
成功した共有努力の鍵は、データレイヤーの適切なレベルで一様資源識別子(URI)を十分に、かつ適切に使用することである。最初から最大の問題を対象とするのではなく、ユースケースを主導することが常に最善である。Gardnerは、「最初の段階で政治的な動物たちに食いちぎられようとしていた私たちは、ステージの脇から始めました」と振り返っている。これにより、脇で物事を行い、その方法で価値を提供することを学んだ。
【ニュース解説】
AstraZenecaの研究開発リード、Ben Gardner氏は、研究開発文化におけるFAIR(発見可能、アクセス可能、相互運用可能、再利用可能)データ共有の拡大について語りました。Gardner氏は、過去20年間にわたり、薬物発見チームとの作業経験を持ち、特に過去6年間はAstraZenecaでの経験から、チーム全員がすぐにウェブオントロジー言語(OWL)、グラフ思考、ウェブセマンティクスに取り組むことを期待しないことの重要性を学んだと述べています。彼は、これらの概念と方法をセマンティックインフラストラクチャの下に置くことを提案しています。
FAIRデータの自動化能力は非常に強力ですが、その広範な採用には、新しいツール、思考、ワークフローの変更を大量に必要としない段階的な変更が必要です。そのため、AstraZenecaのR&Dチームは、Snowflakeを介して共有されるフラットテーブルを介して共有および更新される制御された語彙を通じてデータ品質を向上させることに焦点を当てています。制御された語彙には、Simple Knowledge Organization System eXtension for Labels(SKOS-XL)が使用されており、これはOWLおよびその他のW3Cセマンティックスタックと互換性のある、広く使用されているサポートされたW3C標準です。
成功した共有努力の鍵は、データレイヤーの適切なレベルで一様資源識別子(URI)を十分に、かつ適切に使用することです。最初から最大の問題を対象とするのではなく、ユースケースを主導することが常に最善です。Gardner氏は、「最初の段階で政治的な動物たちに食いちぎられようとしていた私たちは、ステージの脇から始めました」と振り返っています。これにより、脇で物事を行い、その方法で価値を提供することを学んだと述べています。
この取り組みの背景には、研究開発プロセスにおけるデータ共有と管理の効率化があります。FAIR原則に基づくデータ管理は、研究データの発見性、アクセス性、相互運用性、再利用性を高めることで、研究の進捗を加速させ、イノベーションを促進する可能性があります。しかし、このような変革を実現するには、既存のワークフローや思考パターンに大きな変更を加えることなく、段階的に技術を導入し、チームメンバーの理解と協力を得ることが重要です。
このアプローチは、研究開発におけるデータ管理の未来に向けた重要な一歩を示しています。データの品質を向上させ、研究成果を最大化するために、FAIR原則に基づくデータ共有と管理の方法論が、より多くの研究機関や企業で採用されることが期待されます。
from Scaling FAIR data sharing in an R&D culture.