Connect with us

ビッグデータニュース

Snowflake、新オープンデータカタログ「Polaris」発表でデータ管理革新へ

Snowflakeがデータクラウドサミットで発表したPolaris Catalogは、Apache Icebergに準拠し、データを索引付け・整理する新オープンデータカタログです。自己ホスティングとSnowflakeホスティングの両方で利用可能で、90日以内にオープンソース化予定。異なるクエリエンジンとの相互運用性を提供し、データ管理の柔軟性を高めます。【用語解説とAIによる専門的コメントつき】

Published

on

 - innovaTopia - (イノベトピア)

Snowflakeは、年次データクラウドサミットでApache Icebergテーブルフォーマットに準拠したデータを索引付け・整理するための新しいオープンデータカタログ実装であるPolaris Catalogを発表した。このカタログは、自己ホスティングとSnowflakeホスティングの両方のオプションで利用可能であり、今後90日間でオープンソース化される予定である。Polarisは、企業がデータ資産から価値を引き出すために使用したい他のクエリエンジンとの相互運用が可能である。

Snowflakeの製品担当EVPであるChristian Kleinermanは、PolarisがSnowflakeのクエリエンジンとの連携を目的とした機能ではなく、複数のクエリエンジンを組み合わせて使用し、任意の方法で読み書き活動を調整できるようにするために、複数の業界パートナーを集めていると述べた。

Delta Lake、Apache Iceberg、Apache Hudiの3つのオープンテーブルフォーマットがデータエコシステムを主導してきた。Snowflakeは、これまで独自のテーブルフォーマットを使用してきたが、Apache Icebergへの完全なコミットメントを表明し、顧客がそれを活用していることをKleinermanは指摘した。

企業は、異なるエンジン(これらのフォーマットをサポートする)を使用してデータに対してクエリを実行し、下流のユーザーやアプリに回答を提供できるように、データカタログ(これらのフォーマットのいずれかをサポートする)を自由に組み合わせたいと考えている。しかし、特にDelta Lakeカタログを使用している企業は、その実装が完全にオープンではないと頻繁に指摘している。

これらの懸念に対処し、Icebergへのコミットメントをさらに強化するため、Snowflakeは完全にIcebergのオープンソースRESTプロトコルに基づいたPolaris Catalogを発表した。この提供により、Apache Flink、Apache Spark、Dremio、Python、Trinoなど、Iceberg Rest APIをサポートする任意のエンジンを使用してデータにアクセスし、取得するためのオープンスタンダードが提供される。

SnowflakeはPolarisの最終調整を行っており、6月中に最初の企業顧客にプレビューとして提供する予定である。Amazon Web Services (AWS)、Confluent、Dremio、Google Cloud、Microsoft Azure、Salesforceを含む複数の主要企業がこの取り組みを支持していることを表明している。

【ニュース解説】

Snowflakeが年次データクラウドサミットで発表したPolaris Catalogは、Apache Icebergテーブルフォーマットに準拠したデータを索引付け・整理するための新しいオープンデータカタログ実装です。このカタログは、自己ホスティングとSnowflakeホスティングの両方のオプションで提供され、今後90日間でオープンソース化される予定です。Polarisは、企業がデータ資産から価値を引き出すために使用したい他のクエリエンジンと相互運用が可能です。

この取り組みの背景には、データ管理と分析の分野でのオープンスタンダードの重要性が高まっていることがあります。Delta Lake、Apache Iceberg、Apache Hudiといったオープンテーブルフォーマットがデータエコシステムを主導しており、企業はこれらのフォーマットをサポートする異なるエンジンを使用してデータに対してクエリを実行し、下流のユーザーやアプリに回答を提供できるようにしたいと考えています。しかし、特にDelta Lakeカタログを使用している企業からは、その実装が完全にオープンではないという懸念が頻繁に指摘されていました。

Polaris Catalogの提供により、Apache Flink、Apache Spark、Dremio、Python、Trinoなど、Iceberg Rest APIをサポートする任意のエンジンを使用してデータにアクセスし、取得するためのオープンスタンダードが提供されます。これにより、企業はデータ管理の柔軟性を高め、ベンダーロックインの懸念を排除することができます。

この動きは、データ管理と分析の分野におけるオープンスタンダードの普及を促進し、企業が異なるデータソースやツールを自由に組み合わせて使用できるようにすることで、イノベーションの加速に寄与する可能性があります。また、Snowflakeはセキュリティの面でも取り組みを進めており、異なるエンジン間での権限やセキュリティの整合性を保つための仕組みを検討しています。これは、データの安全性とプライバシーを確保する上で重要な要素です。

しかし、オープンスタンダードの普及には、技術的な課題や業界内での合意形成の難しさなど、克服すべき課題も存在します。また、異なるツールやプラットフォーム間での完全な互換性を実現するためには、継続的な技術的な改善とコミュニティによる協力が必要です。

長期的には、Polaris Catalogのような取り組みが成功すれば、データの利活用がより柔軟になり、企業が新しい洞察を得るためのツールやサービスの選択肢が広がることが期待されます。これは、データ駆動型の意思決定を促進し、ビジネスの成長やイノベーションを支援する可能性を秘めています。

from Snowflake unveils Polaris, a vendor-neutral open catalog implementation for Apache Iceberg.

ビッグデータニュース

IBMが警鐘、AI時代のデータ管理リスクと新サービス発表

AI時代のデータ管理を再評価するIBMブログは、大規模言語モデル(LLM)による機密データ漏洩のリスクを指摘。IBMの「gen AIデータ摂取ファクトリー」は企業データの安全な統合を促進し、リスク軽減と規制遵守を支援します。データ保護、アクセス管理、監査性向上が鍵とされ、IBMコンサルティング®が専門知識を提供。【用語解説とAIによる専門的コメントつき】

Published

on

By

IBMが警鐘、AI時代のデータ管理リスクと新サービス発表 - innovaTopia - (イノベトピア)

AI時代におけるデータ管理の再評価について、IBMブログが新たなリスクとして、大規模言語モデル(LLM)を通じた機密データの漏洩や、規制当局や政府からの要求の増加を指摘しています。組織は、エンタープライズや非公開データを大規模言語モデルに適切に組み込むために、データ管理の基本原則を見直すことが重要です。データの保護能力の検証と作成、データアクセス、使用、第三者とのエンゲージメントの管理、監査可能性と監督の向上などが挙げられます。

IBMでは、企業データの潜在能力を解放するために、IBM gen AIデータ摂取ファクトリーという管理サービスを開発しました。このサービスは、企業データをgen AIソリューションに統合するプロセスを簡素化し、加速します。データのスケーラブルな摂取、規制とコンプライアンス、データプライバシー管理などが主な機能です。このサービスを使用することで、データ統合にかかる時間の削減、企業によるgen AIアプリケーションのデータ使用規制の遵守、リスクの軽減、一貫性と再現性のある結果の提供が可能になります。

IBMコンサルティング®のチームは、元規制当局者、業界リーダー、技術専門家から成り、この複雑なデータリスクをナビゲートするためのクロスファンクショナルな専門知識を提供します。

【ニュース解説】

現代の技術業界において、生成型AI(Generative AI)は、新たなデータリスクをもたらし、規制当局や政府からの要求を増加させています。特に、大規模言語モデル(LLM)を通じた機密データの漏洩が懸念されています。このような環境を成功裏に航行するためには、組織がデータ管理の基本原則を見直し、エンタープライズや非公開データをLLMに適切に組み込むための確かなアプローチを使用することが重要です。

データ保護能力の検証と作成には、暗号化、匿名化、トークン化などの従来の機能に加えて、機械学習を使用して自動的にデータを分類する能力(感度、分類体系の整合性など)を作り出すことが含まれます。データの発見とカタログ化ツールは役立ちますが、組織の独自のデータ理解に特化した分類を行うために強化する必要があります。これにより、組織は新しいポリシーを効果的に適用し、データの概念的理解とデータソリューションの実装現実との間のギャップを埋めることができます。

データアクセス、使用、第三者とのエンゲージメントの管理、監査可能性と監督の向上には、データの使用方法、変更時期、第三者とのやり取りを通じてデータが共有された場合の追跡が含まれます。データアクセスを制限するだけでなく、データがアクセスされ、分析的および運用ソリューション内でどのように適用されるかの使用事例を追跡することが不可欠です。

IBMでは、企業データの潜在能力を解放するために「IBM gen AIデータ摂取ファクトリー」という管理サービスを開発しました。このサービスは、企業データを生成型AIソリューションに統合するプロセスを簡素化し、加速するための事前定義されたアーキテクチャとコードの青写真を提供し、管理サービスとして展開されます。データのスケーラブルな摂取、規制とコンプライアンス、データプライバシー管理などが主な機能であり、企業はデータ統合にかかる時間の削減、データ使用規制の遵守、リスクの軽減、一貫性と再現性のある結果の提供を実現できます。

このような取り組みは、データリスクの複雑さをナビゲートするために、元規制当局者、業界リーダー、技術専門家など、様々な分野の専門知識を持つIBMコンサルティング®のチームによって支えられています。この取り組みにより、企業は生成型AIの活用を進めながら、データの安全性を確保し、規制への対応を強化することができるようになります。また、データの透明性を高めることで、モデルのリスクを減らし、規制当局への説明責任を果たすために費やす時間を短縮することが可能です。これらの取り組みは、データ管理の新たな標準を設定し、将来の技術革新に向けた基盤を築くことに寄与するでしょう。

from Re-evaluating data management in the generative AI age.

Continue Reading

ビッグデータニュース

Onehouseが3500万ドル調達、データレイク技術の未来を切り拓く

Onehouseがオープンデータレイクハウス技術の発展のために3500万ドルを調達し、総資金は6800万ドルに。MicrosoftとGoogleの支援を受け、Apache XTableの開発を加速。この技術はデータの統合と分析を容易にし、企業の競争優位性を高める可能性があります。【用語解説とAIによる専門的コメントつき】

Published

on

By

Onehouseが3500万ドル調達、データレイク技術の未来を切り拓く - innovaTopia - (イノベトピア)

Onehouseは、オープンデータレイクハウス技術の進展を目指し、3500万ドルの資金を確保しました。この資金調達はシリーズBラウンドであり、Craft Venturesが主導し、AdditionとGreylock Partnersが参加しました。これにより、Onehouseの総資金は6800万ドルに達しました。Onehouseは、オープンソースのApache Hudi技術に基づいており、異なるテーブルフォーマット、データカタログ、クエリエンジン、クラウドプロバイダーを使用できる相互運用可能なプラットフォームを提供することを目指しています。

2023年11月には、MicrosoftとGoogleがOnehouseを支援し、OneTableオープンソースデータレイクテーブルフォーマットの相互運用技術に参加しました。この取り組みはその後、Apache Software Foundationに移管され、Apache XTableとして再ブランドされました。新たな資金調達により、OnehouseはXTableの開発と、Universal Data Lakehouseプラットフォームの進展を加速させる予定です。

Apache XTableは、異なるデータレイクテーブルフォーマット間の課題を解決することを目的としています。Microsoftは、Microsoft Build 2024カンファレンスで、Microsoft FabricがXTableを使用してSnowflakeの書き込みとApache IcebergおよびDelta Lakeの読み取り間の変換を可能にする機能を発表しました。

また、OnehouseはApache Hudi技術の進化にも注力しており、新しい並行性モデルや非構造化データおよび構造化データのサポートを含むApache Hudi 1.0リリースの作業が進行中です。このリリースでは、非プライマリキーに対する新しいセカンダリインデックスシステムと、それらのインデックスを使用したフィルタリングクエリが導入される予定です。さらに、データレイク内のデータに対してベクターおよびテキスト検索を可能にするベクター検索インデックスのサポートが追加される予定です。

【ニュース解説】

Onehouseは、オープンデータレイクハウス技術の発展を目指し、3500万ドルの資金を確保しました。この技術は、データの保存、管理、分析をより効率的に行うためのもので、異なるデータ形式やクラウドサービス間での相互運用性を高めることを目的としています。Onehouseの取り組みは、データ管理の柔軟性とアクセス性を向上させることにより、企業がデータをより有効に活用できるようにすることにあります。

この資金調達は、Onehouseが提供する技術の開発と市場浸透を加速させるためのものです。特に注目されるのは、MicrosoftとGoogleが支援するApache XTableプロジェクトです。これは、異なるデータレイクテーブルフォーマット間の相互運用性を実現するための技術で、データの利用可能性と柔軟性を大幅に向上させる可能性があります。

Apache XTableの導入により、企業は異なるデータソースやクラウドプラットフォームを跨いでデータを統合し、分析することが容易になります。これは、ビッグデータの時代において、企業が直面するデータの断片化という課題に対する有効な解決策を提供します。また、OnehouseはApache Hudi技術の進化にも力を入れており、データレイク内でのデータ管理とクエリのパフォーマンスを向上させる新機能を開発しています。

このような技術の進展は、データ駆動型の意思決定を行う企業にとって大きなメリットをもたらします。データの統合と分析が容易になることで、より迅速かつ正確なビジネスインサイトを得ることが可能になり、競争優位性の確保につながります。しかし、異なるデータフォーマットやクラウドサービス間での完全な相互運用性を実現するには、技術的な課題やプライバシー、セキュリティに関する懸念を克服する必要があります。

長期的には、Onehouseの取り組みは、オープンソースコミュニティとの協力により、データ管理技術の標準化を促進することにも寄与するでしょう。これにより、データの相互運用性とアクセス性がさらに向上し、企業がデータを活用するための障壁が低減されることが期待されます。また、新しいデータ分析ツールやサービスの開発を促進し、データ駆動型のイノベーションを加速させる可能性もあります。

from Onehouse secures $35M to advance open data lakehouse technology.

Continue Reading

ビッグデータニュース

フランス政府、国防のためAtos買収提案 – 国家安全保障を守る戦略的動き

フランス政府が国家安全保障を守るため、Atosのビッグデータとサイバーセキュリティ部門の買収を提案。この戦略は、外国の支配から重要技術を保護し、フランスの技術力とサイバーセキュリティ能力を強化することを目指す。【用語解説とAIによる専門的コメントつき】

Published

on

By

フランス政府、国防のためAtos買収提案 - 国家安全保障を守る戦略的動き - innovaTopia - (イノベトピア)

フランス政府がAtosのビッグデータとサイバーセキュリティ部門の買収を提案した。この動きは、フランスの国防利益を外国の支配から守るためであり、Atosは国家安全保障上重要な技術を提供している。Atosは国防プログラム用のスーパーコンピュータ構築や軍のビッグデータプラットフォーム確立に貢献し、またパリオリンピックのサイバーセキュリティプロバイダでもある。

フランス政府のこの関与は、国家安全保障における重要な役割を果たしており、Atosのノウハウと労働力が一体化されたままであることを重視している。他のヨーロッパ国と同様に、フランス政府は重要な価値を提供する企業に直接的な関与を持つ。これに対し、米国政府は民間のITやサイバーセキュリティ企業の株式買収は少なく、外国の投資に対する緊密な監視を行い、国家安全保障上の理由から特定の企業買収を阻止することがある。

Atosの買収が実現すれば、フランス政府は技術とサイバーセキュリティ能力を大幅に強化できる。フランス政府が企業を買収することは稀であるが、このアプローチにより他の政府も同様の手法を取る可能性がある。

【ニュース解説】

フランス政府がAtosのビッグデータとサイバーセキュリティ部門の買収を提案したことは、国家安全保障を守るための重要な一歩です。Atosは、国防プログラム用のスーパーコンピュータの構築や軍のビッグデータプラットフォームの確立、さらにはパリオリンピックのサイバーセキュリティプロバイダとしての役割を果たしています。このように、Atosはフランスの国防と安全保障において中心的な役割を担っており、その技術やノウハウは非常に価値が高いと言えます。

フランス政府のこの動きは、国内の重要な技術やサービスが外国の支配下に入ることを防ぐためのものです。これは、国家安全保障上のリスクを最小限に抑え、フランスの主権を保護するために不可欠です。また、フランス政府がAtosのような企業に直接関与することは、他のヨーロッパ諸国でも見られる傾向であり、国家の重要なインフラやサービスを保護するための一般的な手段となっています。

一方で、米国では、政府が民間のITやサイバーセキュリティ企業を直接買収することは稀ですが、外国の投資に対する厳しい監視を行い、国家安全保障に影響を与える可能性のある買収を阻止することがあります。これは、国家安全保障を守るための異なるアプローチであり、各国が自国の状況に応じて適切な手段を選択していることがわかります。

Atosの買収が成功すれば、フランス政府は国内の技術とサイバーセキュリティ能力を大幅に強化することができます。これは、サイバー攻撃や情報戦に対する防御力を高める上で非常に重要です。また、このような政府による企業買収の動きは、他の国々にも影響を与え、同様の措置を検討するきっかけになる可能性があります。

このニュースは、国家安全保障と技術の関係、政府と民間企業の関わり方について、新たな議論を呼び起こすことでしょう。また、将来的には、国家安全保障を理由にした企業買収や投資が、国際的なビジネスや技術開発にどのような影響を与えるのか、注目されるテーマとなります。

from France Seeks to Protect National Interests With Bid for Atos Cybersec.

Continue Reading

Trending