Appleが画像を見て質問に答えられる大規模言語モデル「Ferret」を開発、ウェイトの情報が公開される画像とテキストを組み合わせてタスクをこなせるマルチモーダル大規模言語モデルの「Ferret」のウェイト情報をAppleが公開しました。ウェイトのデータはCC-BY-NCライセンスでの提供となっており、研究目的でのみ利用可能です。·gigazine.net·Dec 26, 2023Appleが画像を見て質問に答えられる大規模言語モデル「Ferret」を開発、ウェイトの情報が公開される
「YouTubeにはどれだけの動画が保存されていてどれだけの人が見ているのか」を科学的に調査するために開発された手法とは?動画配信プラットフォームのYouTubeは今やインターネットユーザーのほとんどが一度はお世話になっているといっても過言ではないサービスとなっており、ソーシャルメディアの中では最大規模を誇ります。マサチューセッツ大学アマースト校で公共政策、コミュニケーション、情報学を教えるイーサン・ザッカーマン准教授が、このYouTubeの規模を科学的に把握するために構築した調査方法を解説しています。·gigazine.net·Dec 26, 2023「YouTubeにはどれだけの動画が保存されていてどれだけの人が見ているのか」を科学的に調査するために開発された手法とは?
単一の画像を基に周囲360度から見たような画像・アニメーションを制作できる「Splatter Image」が登場たった1枚の入力画像から画像に写ったオブジェクトの3D形状を出力するレンダラー「Splatter Image」が公開されました。·gigazine.net·Dec 26, 2023単一の画像を基に周囲360度から見たような画像・アニメーションを制作できる「Splatter Image」が登場
画像生成AI「Stable Diffusion」などに使われた50億枚超の画像セット「LAION-5B」に1008枚の児童ポルノ画像が入っていることが判明し削除へスタンフォード大学インターネット天文台(SIO)の調査により、画像生成AI「Stable Diffusion」などのトレーニングに利用されているオープンデータセットの「LAION-5B」に、児童性的虐待画像(CSAM)が含まれていることが明らかになりました。CSAMの疑いのある画像は3226枚で、そのうち1008枚が外部機関の検証によりCSAMであると確認されました。·gigazine.net·Dec 23, 2023画像生成AI「Stable Diffusion」などに使われた50億枚超の画像セット「LAION-5B」に1008枚の児童ポルノ画像が入っていることが判明し削除へ
顧客を過去の万引犯と間違える低品質AIを導入したドラッグストアに5年間技術使用禁止の罰が与えられる顧客の顔をデータベースと照合して問題のある人物を特定するAIを導入した大手ドラッグストア「ライト・エイド」に対し、アメリカの連邦取引委員会(FTC)が「監視目的での顔認識技術使用の禁止」を言い渡しました。これによりライト・エイドは技術使用を5年間禁じられ、過去に収集したデータの保護を行う義務も課せられました。·gigazine.net·Dec 23, 2023顧客を過去の万引犯と間違える低品質AIを導入したドラッグストアに5年間技術使用禁止の罰が与えられる
チャットAIが出力した文書を画像生成AIで画像化するプロセスを伝言ゲームのように何度も繰り返すと画像がどんな風に変化していくかがわかる「Image Telephone」「チャットAIに画像を入力してキャプションを付けさせ、これを画像生成AIのDALL-Eで画像化し、再びチャットAIに入力して……」というプロセスを何度も繰り返し、AIが生成する画像がどのように変化していくのかを観察できるのが「Image Telephone」です。作者のelijahbenizzyさんは「自分でやってみたところ結果が非常に興味深いものだったためアプリ化して誰でも気軽に体験できるようにしてみました」と説明しています。·gigazine.net·Dec 23, 2023チャットAIが出力した文書を画像生成AIで画像化するプロセスを伝言ゲームのように何度も繰り返すと画像がどんな風に変化していくかがわかる「Image Telephone」
秒間100枚以上の画像を生成できる爆速画像生成パイプライン「StreamDiffusion」が登場ソースからのデータ入力、機械学習モデルへのデータ出力、学習パターンの調整といった一連の処理構造「パイプライン」をリアルタイム画像生成のために最適化した「StreamDiffusion」が登場しました。·gigazine.net·Dec 23, 2023秒間100枚以上の画像を生成できる爆速画像生成パイプライン「StreamDiffusion」が登場
プーチン大統領のディープフェイクが本物のプーチン大統領と公開質疑で対面し本人に「影武者はいるの?」と質問2023年12月14日にロシアのウラジーミル・プーチン大統領が年末恒例の質疑応答イベントを開催しました。このイベントの中で国民からの質問として「プーチン大統領の外見や声を再現したディープフェイクがプーチン大統領に質問する映像」が映し出され、プーチン大統領が自身のディープフェイクに対して応答する一幕がありました。·gigazine.net·Dec 19, 2023プーチン大統領のディープフェイクが本物のプーチン大統領と公開質疑で対面し本人に「影武者はいるの?」と質問
AIモデルは「網膜の写真」だけで子どもが自閉症かどうか100%見分けられるという研究結果コミュニケーションや行動などに特徴がみられる自閉症スペクトラム症(ASD)の子どもを「網膜の写真」だけで100%の精度で見分けられるディープラーニングAIモデルを、韓国の延世大学医学部の研究チームが開発しました。ASDの子どもを早期診断する客観的なスクリーニングツールとして、AIが有望な選択肢になる可能性があると期待されています。·gigazine.net·Dec 19, 2023AIモデルは「網膜の写真」だけで子どもが自閉症かどうか100%見分けられるという研究結果
Facebookは既に画像生成AIが作ったパクリ投稿で埋め尽くされている2019年に、FacebookがAIでプロフィール画像を合成した偽アカウントを削除したと発表したことが報道されるなど、AIは以前からソーシャルメディアの頭痛の種でしたが、これまでAI画像を見破るのは難しいことではありませんでした。ところが、リアルな画像を大量に出力できる生成AIの発達により、かつて予言されていた「生成AIが大量生産したゴミコンテンツが生身の人間の努力を圧倒する」という未来が既に現実のものとなっていると、IT系ニュースサイトの404 Mediaが報じました。·gigazine.net·Dec 19, 2023Facebookは既に画像生成AIが作ったパクリ投稿で埋め尽くされている
簡単なテキストから写実的な動画を生成する拡散モデル「W.A.L.T」が登場スタンフォード大学やGoogleの研究チームが、テキストから写実的な動画を生成する拡散モデルである「W.A.L.T」を発表しました。実際に「W.A.L.T」を使用して生成した動画も多数公開されています。·gigazine.net·Dec 12, 2023簡単なテキストから写実的な動画を生成する拡散モデル「W.A.L.T」が登場
たった1枚の画像から高品質なアニメーションを作成できる技術が登場、人型のイラストや写真が1枚あれば自由自在に振付を付与できる元となる画像データと「動作」のデータを入力することで元の画像を動作データの通りにアニメーションさせる技術の論文がAlibabaの研究チームから発表されました。「Animate Anyone」と名付けられたこの技術を使用することで、ちらつきの少ない高品質なアニメーションが生成可能です。·gigazine.net·Dec 8, 2023たった1枚の画像から高品質なアニメーションを作成できる技術が登場、人型のイラストや写真が1枚あれば自由自在に振付を付与できる
画像生成AIでさまざまなだまし絵を自動生成する「Visual Anagrams」見る方向や絵の形を変えることで、意味や見た目が変わってしまう「だまし絵」を、拡散モデルの画像生成AIで自動生成する技術「Visual Anagrams」をミシガン大学の研究チームが発表しました。·gigazine.net·Dec 8, 2023画像生成AIでさまざまなだまし絵を自動生成する「Visual Anagrams」
iPhoneが100万分の1の確率で偶然撮影してしまった「あまりにも不思議で奇妙な写真」とは?AppleのiPhoneやGoogleのPixelなど、ハイエンドスマートフォンには高機能なカメラが搭載されており、誰でも簡単にいつでも美麗な写真を撮影できます。そんなiPhoneのカメラで「決して現実では起こり得ない光景」が偶然撮影できてしまった非常に珍しい例を、カメラ関連のニュースサイトであるPetaPixelが紹介しています。·gigazine.net·Dec 8, 2023iPhoneが100万分の1の確率で偶然撮影してしまった「あまりにも不思議で奇妙な写真」とは?
世界初の「スマホで自撮りできる巨大なカメラ・オブスキュラ」とはどんなカメラなのか?小さな穴を使ってスクリーンに目の前の光景を投影する「カメラ・オブスキュラ」という装置は、写真を撮影するカメラの元祖といえます。イギリスのファルマス大学で写真学を教えるデビッド・ホワイト氏が約2メートル四方の巨大な「自撮り用カメラ・オブスキュラ」を開発したと、写真やカメラに関するニュースサイト・PetaPixelが紹介しています。·gigazine.net·Dec 8, 2023世界初の「スマホで自撮りできる巨大なカメラ・オブスキュラ」とはどんなカメラなのか?
画像を見て質問に答えられるオープンソースなGPT-4レベルのAI「LLaVA-1.5」をGCP上で動作させてみたMicrosoftやウィスコンシン大学マディソン校などの研究チームが開発し、2023年4月17日に公開した「LLaVA」は「視覚」を持つAIで、画像を入力するとその画像に基づいて返答を行うことができます。2023年10月5日に登場したLLaVA-1.5はさらにクオリティが向上しているとのことなので、実際にGoogleのクラウドコンピューティングサービス「Google Cloud Platform(GCP)」上で動作させてみました。·gigazine.net·Dec 8, 2023画像を見て質問に答えられるオープンソースなGPT-4レベルのAI「LLaVA-1.5」をGCP上で動作させてみた
Metaが画像生成AI「Imagine」を無料で使えるウェブアプリをリリース、Emuモデルを利用しプロンプトごとに4つの画像を生成可能Metaが画像生成AI「Imagine」を無料で使えるウェブアプリ「Imagine With Meta AI」を公開しました。Imagine With Meta AIは無料で利用可能で、文章(プロンプト)を入力するだけで画像を4枚生成できるとのこと。すでに海外メディアが作例を公開しています。·gigazine.net·Dec 8, 2023Metaが画像生成AI「Imagine」を無料で使えるウェブアプリをリリース、Emuモデルを利用しプロンプトごとに4つの画像を生成可能
文字・音楽・画像を同時に処理する「マルチモーダルAI」の性能がよく分かるGoogleの「Gemini」ハウツー動画11種を解説2023年12月6日、Googleが文字・音楽・画像を同時に処理するマルチモーダルAI「Gemini」をリリースしました。リリースに合わせてGeminiの使い方解説動画がアップロードされていたので確認してみました。·gigazine.net·Dec 8, 2023文字・音楽・画像を同時に処理する「マルチモーダルAI」の性能がよく分かるGoogleの「Gemini」ハウツー動画11種を解説
AI生成顔写真で人間になりすましたAIライターの記事を老舗スポーツメディアが掲載AIの性能は日々進歩しており、大手メディアが記事作成に文章生成AIを導入した事例もあります。新たに、大手スポーツ関連メディアの「Sports Illustrated」が人間が作成したように見せかけたAI生成記事を公開していたことが明らかになりました。Sports IllustratedはAI生成記事の存在が報じられた後に当該記事を削除しています。·gigazine.net·Nov 30, 2023AI生成顔写真で人間になりすましたAIライターの記事を老舗スポーツメディアが掲載
ついにWindowsの「ペイント」に画像生成AIが搭載されイラスト生成や写真生成が可能にWindowsの標準お絵描きアプリ「ペイント」に画像生成機能を追加するアップデートが実施されました。画像生成機能はOpenAIが開発した画像生成AI「DALL-E」を用いて実現されており、すでに海外メディアが高品質なイラストの生成例を公開しています。·gigazine.net·Nov 30, 2023ついにWindowsの「ペイント」に画像生成AIが搭載されイラスト生成や写真生成が可能に
Amazonがプロンプトからさまざまな画像を生成できる画像生成AI「Titan Image Generator」のプレビュー版をAmazon Bedrockユーザー向けにリリース2023年11月27日から12月1日にかけてアメリカのラスベガスで開催されているAWSのカンファレンスイベント「AWS re:Invent」において、Amazonが画像生成AI「Titan Image Generator」のプレビュー版をAWSの顧客向けに発表しました。·gigazine.net·Nov 30, 2023Amazonがプロンプトからさまざまな画像を生成できる画像生成AI「Titan Image Generator」のプレビュー版をAmazon Bedrockユーザー向けにリリース
たった1枚の写真から高解像度の3DCGモデルをAIで生成できる「Human-SGD」が発表される写真から3DCGモデルを作成するにはさまざまな方向から被写体を何枚も撮影する必要があります。クウェート大学・Meta・メリーランド大学の研究者が、たった1枚の写真から高解像度のCGモデルを生成する「Human-SGD」を発表しました。·gigazine.net·Nov 25, 2023たった1枚の写真から高解像度の3DCGモデルをAIで生成できる「Human-SGD」が発表される
テキストや画像から動画を生成するAI「Stable Video Diffusion」をStability AIが公開へ画像生成AI「Stable Diffusion」を開発するStability AIが、テキストや画像から高解像度の動画を生成できる潜在動画拡散モデル「Stable Video Diffusion」を公開しました。·gigazine.net·Nov 22, 2023テキストや画像から動画を生成するAI「Stable Video Diffusion」をStability AIが公開へ
MicrosoftのAI画像生成サービスではディズニー作品のイラストを生成できてしまうMicrosoftはOpenAIの開発した画像生成AI「DALL·E 3」を活用した画像生成サービス「Image Creator」を公開しています。ところが、Image Creatorでは著作権に厳しいことで知られるディズニーのキャラクターが含まれる画像を生成可能であることが話題になっています。·gigazine.net·Nov 22, 2023MicrosoftのAI画像生成サービスではディズニー作品のイラストを生成できてしまう
AI搭載で手のひらに画面投影可能なクリップ型ウェアラブルデバイス「Ai Pin」をHumaneが正式発表HumaneがAI搭載のウェアラブルデバイス「Ai Pin」を正式に発表しました。本体価格は699ドル(約10万円)で、月額24ドル(約3600円)のサブスクリプションプランに加入する必要があり、予約は2023年11月16日、出荷は2024年初めとなっています。·gigazine.net·Nov 18, 2023AI搭載で手のひらに画面投影可能なクリップ型ウェアラブルデバイス「Ai Pin」をHumaneが正式発表
死亡した俳優をAIで復元して映画などに出演させるには生きている間に同意を得る必要があるハリウッドの俳優や脚本家が「仕事を奪うようなAIの規制」を求めて実施したストライキは、ハリウッド俳優による史上最長のストライキとなったのち、2023年11月10日に終了しました。このストライキを通じ、アメリカテレビ・ラジオ芸術家連盟(SAG-AFTRA)はハリウッドの映画スタジオと10億ドル(約1500億円)規模の契約を結ぶことに成功しています。この契約の中には「死亡した俳優のAIコピー」に対する保護策もあるそうです。·gigazine.net·Nov 18, 2023死亡した俳優をAIで復元して映画などに出演させるには生きている間に同意を得る必要がある
ペンの動きをカメラで捉えてデジタルで描画する6DoFを実現したスタイラスペン「D-POINT」タブレットやスマートフォンなどに付属するデジタルポインティングデバイス「スタイラスペン」は、通常ペン先とモニターが接触するか、近づくことでデバイスに入力情報を伝えるものです。新たに登場した「D-POINT」は、ペン尻に付いたマーカーをカメラが読み取ることで文字を入力できます。·gigazine.net·Nov 18, 2023ペンの動きをカメラで捉えてデジタルで描画する6DoFを実現したスタイラスペン「D-POINT」
文化財の保護にも活用される「遺産を3Dスキャンして保存する技術」の進歩ドローン、3Dプリンター、民間の衛星インターネットなどの比較的新しい技術が戦争へ投入されていることが近年伝えられていますが、もうひとつの画期的な技術「3Dスキャン」が、戦争の加速ではなく戦争による文化財の破壊を緩和するために用いられています。現実の物体をスキャンしてデジタルに変換する技術の進歩について、VR研究者のアーロン・フランク氏が解説しました。·gigazine.net·Nov 18, 2023文化財の保護にも活用される「遺産を3Dスキャンして保存する技術」の進歩
YouTubeがAI生成・改変動画をはっきり明示する方針を発表、クリエイターに情報開示を義務づけ違反するとパートナープログラム停止も「視聴者に誤解を与え、重大な危害をもたらす可能性がある」として、YouTubeが「AIを使用して作られた動画」であることをはっきりと示すように義務づける方針を明らかにしました。今後は動画プレイヤーや説明欄を見ることで、AI生成であることがわかるようになります。·gigazine.net·Nov 18, 2023YouTubeがAI生成・改変動画をはっきり明示する方針を発表、クリエイターに情報開示を義務づけ違反するとパートナープログラム停止も
YouTube Premiumが「対話型AI機能」「高画質版の拡大」など新しい特典を発表YouTubeは2023年11月15日に、YouTube Premiumのユーザー向けにいくつかの新機能を拡張すると発表しました。新機能には、多くのデバイスで高画質設定の「1080p Premium」を使えたり、YouTubeを継続的に使用することで実績バッジを獲得できたりといったものが追加されています。·gigazine.net·Nov 18, 2023YouTube Premiumが「対話型AI機能」「高画質版の拡大」など新しい特典を発表