【ダイジェスト】
Appleは、ユーザーが写真に対して行いたい変更を平易な言葉で説明することで編集を可能にするAI画像ツールを開発しました。このツールはMGIE(MLLM-Guided Image Editing)と呼ばれ、カリフォルニア大学サンタバーバラ校との共同作業により作成されました。MGIEは、画像をトリミング、リサイズ、反転させたり、フィルターを追加したりすることができます。また、写真内の特定のオブジェクトを変形させたり、より明るく見せたりするなど、単純から複雑な画像編集タスクに対応しています。
このモデルは、ユーザーが写真に対して何を変更したいかをタイプするだけで、その編集を実現します。例えば、「もっと健康的にして」と入力すると、ピザの写真に野菜のトッピングが追加されます。また、サハラのトラの写真が暗い場合、「もっとコントラストをつけて明るく見せる」と指示すると、写真が明るくなります。
AppleはMGIEをGitHubでダウンロード可能にし、Hugging Face Spaces上でウェブデモも公開しましたが、このモデルの将来の計画については明らかにしていません。Appleはこれまで生成AI分野で大きなプレイヤーではありませんでしたが、AppleのCEOであるTim Cookは、今年デバイスにより多くのAI機能を追加したいと述べています。また、Appleの研究者は、Apple Siliconチップ上でAIモデルをトレーニングすることを容易にするオープンソースの機械学習フレームワークであるMLXを昨年12月にリリースしました。
【ニュース解説】
Appleが、ユーザーが写真編集を平易な言葉で指示するだけで実行できるAI画像ツール「MGIE(MLLM-Guided Image Editing)」を開発しました。このツールは、カリフォルニア大学サンタバーバラ校との共同研究により生まれ、画像のトリミング、リサイズ、反転、フィルター追加などの基本的な編集から、特定のオブジェクトの形状変更や明るさ調整など、より複雑な編集までをサポートします。
この技術の最大の特徴は、ユーザーが編集したい内容を簡単な言葉で説明するだけで、AIがその指示を理解し、想定される編集を自動で行う点にあります。例えば、「ピザをもっと健康的に」と入力すると、AIがピザの写真に野菜のトッピングを追加するなど、直感的な操作で複雑な編集が可能になります。
この技術は、ユーザーが写真編集ソフトウェアに精通していなくても、自分の意図した通りの画像編集を行うことを可能にします。これにより、写真編集のハードルが大幅に下がり、より多くの人がクリエイティブな表現を楽しめるようになると期待されます。
しかし、この技術の普及にはいくつかの潜在的なリスクも伴います。例えば、AIによる自動編集が原因で、写真の意図されていない変更が行われる可能性があります。また、このような技術が広く利用されることで、写真の真実性が疑われるケースも増えるかもしれません。
規制の観点からは、AIによる画像編集技術の進化は、著作権やプライバシー保護の新たな課題を生み出す可能性があります。AIが生成した画像の著作権や、人物のプライバシーに関する問題は、今後の技術発展とともに、より一層の注意が必要になるでしょう。
将来的には、このようなAI画像編集ツールがさらに進化し、ユーザーの意図をより正確に理解し、よりリアルな編集が可能になることが予想されます。また、この技術の応用範囲は写真編集にとどまらず、映像編集やデザイン、さらには教育や医療分野への応用も期待されています。
Appleがこの分野での研究を進めることは、同社がAI技術の発展においても重要な役割を果たす可能性を示しています。また、この技術がAppleのデバイスやサービスに統合されることで、ユーザー体験が大きく向上することが期待されます。
from Apple made an AI image tool that lets you make edits by describing them.