画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2587 bookmarks

Custom sorting

簡単なテキストから写実的な動画を生成する拡散モデル「W.A.L.T」が登場

スタンフォード大学やGoogleの研究チームが、テキストから写実的な動画を生成する拡散モデルである「W.A.L.T」を発表しました。実際に「W.A.L.T」を使用して生成した動画も多数公開されています。

·gigazine.net·Dec 12, 2023

簡単なテキストから写実的な動画を生成する拡散モデル「W.A.L.T」が登場

たった1枚の画像から高品質なアニメーションを作成できる技術が登場、人型のイラストや写真が1枚あれば自由自在に振付を付与できる

元となる画像データと「動作」のデータを入力することで元の画像を動作データの通りにアニメーションさせる技術の論文がAlibabaの研究チームから発表されました。「Animate Anyone」と名付けられたこの技術を使用することで、ちらつきの少ない高品質なアニメーションが生成可能です。

·gigazine.net·Dec 8, 2023

たった1枚の画像から高品質なアニメーションを作成できる技術が登場、人型のイラストや写真が1枚あれば自由自在に振付を付与できる

画像生成AIでさまざまなだまし絵を自動生成する「Visual Anagrams」

見る方向や絵の形を変えることで、意味や見た目が変わってしまう「だまし絵」を、拡散モデルの画像生成AIで自動生成する技術「Visual Anagrams」をミシガン大学の研究チームが発表しました。

·gigazine.net·Dec 8, 2023

画像生成AIでさまざまなだまし絵を自動生成する「Visual Anagrams」

iPhoneが100万分の1の確率で偶然撮影してしまった「あまりにも不思議で奇妙な写真」とは？

AppleのiPhoneやGoogleのPixelなど、ハイエンドスマートフォンには高機能なカメラが搭載されており、誰でも簡単にいつでも美麗な写真を撮影できます。そんなiPhoneのカメラで「決して現実では起こり得ない光景」が偶然撮影できてしまった非常に珍しい例を、カメラ関連のニュースサイトであるPetaPixelが紹介しています。

·gigazine.net·Dec 8, 2023

iPhoneが100万分の1の確率で偶然撮影してしまった「あまりにも不思議で奇妙な写真」とは？

世界初の「スマホで自撮りできる巨大なカメラ・オブスキュラ」とはどんなカメラなのか？

小さな穴を使ってスクリーンに目の前の光景を投影する「カメラ・オブスキュラ」という装置は、写真を撮影するカメラの元祖といえます。イギリスのファルマス大学で写真学を教えるデビッド・ホワイト氏が約2メートル四方の巨大な「自撮り用カメラ・オブスキュラ」を開発したと、写真やカメラに関するニュースサイト・PetaPixelが紹介しています。

·gigazine.net·Dec 8, 2023

世界初の「スマホで自撮りできる巨大なカメラ・オブスキュラ」とはどんなカメラなのか？

画像を見て質問に答えられるオープンソースなGPT-4レベルのAI「LLaVA-1.5」をGCP上で動作させてみた

Microsoftやウィスコンシン大学マディソン校などの研究チームが開発し、2023年4月17日に公開した「LLaVA」は「視覚」を持つAIで、画像を入力するとその画像に基づいて返答を行うことができます。2023年10月5日に登場したLLaVA-1.5はさらにクオリティが向上しているとのことなので、実際にGoogleのクラウドコンピューティングサービス「Google Cloud Platform(GCP)」上で動作させてみました。

·gigazine.net·Dec 8, 2023

画像を見て質問に答えられるオープンソースなGPT-4レベルのAI「LLaVA-1.5」をGCP上で動作させてみた

Metaが画像生成AI「Imagine」を無料で使えるウェブアプリをリリース、Emuモデルを利用しプロンプトごとに4つの画像を生成可能

Metaが画像生成AI「Imagine」を無料で使えるウェブアプリ「Imagine With Meta AI」を公開しました。Imagine With Meta AIは無料で利用可能で、文章(プロンプト)を入力するだけで画像を4枚生成できるとのこと。すでに海外メディアが作例を公開しています。

·gigazine.net·Dec 8, 2023

Metaが画像生成AI「Imagine」を無料で使えるウェブアプリをリリース、Emuモデルを利用しプロンプトごとに4つの画像を生成可能

文字・音楽・画像を同時に処理する「マルチモーダルAI」の性能がよく分かるGoogleの「Gemini」ハウツー動画11種を解説

2023年12月6日、Googleが文字・音楽・画像を同時に処理するマルチモーダルAI「Gemini」をリリースしました。リリースに合わせてGeminiの使い方解説動画がアップロードされていたので確認してみました。

·gigazine.net·Dec 8, 2023

文字・音楽・画像を同時に処理する「マルチモーダルAI」の性能がよく分かるGoogleの「Gemini」ハウツー動画11種を解説

AI生成顔写真で人間になりすましたAIライターの記事を老舗スポーツメディアが掲載

AIの性能は日々進歩しており、大手メディアが記事作成に文章生成AIを導入した事例もあります。新たに、大手スポーツ関連メディアの「Sports Illustrated」が人間が作成したように見せかけたAI生成記事を公開していたことが明らかになりました。Sports IllustratedはAI生成記事の存在が報じられた後に当該記事を削除しています。

·gigazine.net·Nov 30, 2023

AI生成顔写真で人間になりすましたAIライターの記事を老舗スポーツメディアが掲載

ついにWindowsの「ペイント」に画像生成AIが搭載されイラスト生成や写真生成が可能に

Windowsの標準お絵描きアプリ「ペイント」に画像生成機能を追加するアップデートが実施されました。画像生成機能はOpenAIが開発した画像生成AI「DALL-E」を用いて実現されており、すでに海外メディアが高品質なイラストの生成例を公開しています。

·gigazine.net·Nov 30, 2023

ついにWindowsの「ペイント」に画像生成AIが搭載されイラスト生成や写真生成が可能に

Amazonがプロンプトからさまざまな画像を生成できる画像生成AI「Titan Image Generator」のプレビュー版をAmazon Bedrockユーザー向けにリリース

2023年11月27日から12月1日にかけてアメリカのラスベガスで開催されているAWSのカンファレンスイベント「AWS re:Invent」において、Amazonが画像生成AI「Titan Image Generator」のプレビュー版をAWSの顧客向けに発表しました。

·gigazine.net·Nov 30, 2023

Amazonがプロンプトからさまざまな画像を生成できる画像生成AI「Titan Image Generator」のプレビュー版をAmazon Bedrockユーザー向けにリリース

テキストや画像から動画を生成するAI「Stable Video Diffusion」をStability AIが公開へ

画像生成AI「Stable Diffusion」を開発するStability AIが、テキストや画像から高解像度の動画を生成できる潜在動画拡散モデル「Stable Video Diffusion」を公開しました。

·gigazine.net·Nov 22, 2023

テキストや画像から動画を生成するAI「Stable Video Diffusion」をStability AIが公開へ

MicrosoftのAI画像生成サービスではディズニー作品のイラストを生成できてしまう

MicrosoftはOpenAIの開発した画像生成AI「DALL·E 3」を活用した画像生成サービス「Image Creator」を公開しています。ところが、Image Creatorでは著作権に厳しいことで知られるディズニーのキャラクターが含まれる画像を生成可能であることが話題になっています。

·gigazine.net·Nov 22, 2023

MicrosoftのAI画像生成サービスではディズニー作品のイラストを生成できてしまう

AI搭載で手のひらに画面投影可能なクリップ型ウェアラブルデバイス「Ai Pin」をHumaneが正式発表

HumaneがAI搭載のウェアラブルデバイス「Ai Pin」を正式に発表しました。本体価格は699ドル(約10万円)で、月額24ドル(約3600円)のサブスクリプションプランに加入する必要があり、予約は2023年11月16日、出荷は2024年初めとなっています。

·gigazine.net·Nov 18, 2023

AI搭載で手のひらに画面投影可能なクリップ型ウェアラブルデバイス「Ai Pin」をHumaneが正式発表

死亡した俳優をAIで復元して映画などに出演させるには生きている間に同意を得る必要がある

ハリウッドの俳優や脚本家が「仕事を奪うようなAIの規制」を求めて実施したストライキは、ハリウッド俳優による史上最長のストライキとなったのち、2023年11月10日に終了しました。このストライキを通じ、アメリカテレビ・ラジオ芸術家連盟(SAG-AFTRA)はハリウッドの映画スタジオと10億ドル(約1500億円)規模の契約を結ぶことに成功しています。この契約の中には「死亡した俳優のAIコピー」に対する保護策もあるそうです。

·gigazine.net·Nov 18, 2023

死亡した俳優をAIで復元して映画などに出演させるには生きている間に同意を得る必要がある

ペンの動きをカメラで捉えてデジタルで描画する6DoFを実現したスタイラスペン「D-POINT」

タブレットやスマートフォンなどに付属するデジタルポインティングデバイス「スタイラスペン」は、通常ペン先とモニターが接触するか、近づくことでデバイスに入力情報を伝えるものです。新たに登場した「D-POINT」は、ペン尻に付いたマーカーをカメラが読み取ることで文字を入力できます。

·gigazine.net·Nov 18, 2023

ペンの動きをカメラで捉えてデジタルで描画する6DoFを実現したスタイラスペン「D-POINT」

文化財の保護にも活用される「遺産を3Dスキャンして保存する技術」の進歩

ドローン、3Dプリンター、民間の衛星インターネットなどの比較的新しい技術が戦争へ投入されていることが近年伝えられていますが、もうひとつの画期的な技術「3Dスキャン」が、戦争の加速ではなく戦争による文化財の破壊を緩和するために用いられています。現実の物体をスキャンしてデジタルに変換する技術の進歩について、VR研究者のアーロン・フランク氏が解説しました。

·gigazine.net·Nov 18, 2023

文化財の保護にも活用される「遺産を3Dスキャンして保存する技術」の進歩

YouTubeがAI生成・改変動画をはっきり明示する方針を発表、クリエイターに情報開示を義務づけ違反するとパートナープログラム停止も

「視聴者に誤解を与え、重大な危害をもたらす可能性がある」として、YouTubeが「AIを使用して作られた動画」であることをはっきりと示すように義務づける方針を明らかにしました。今後は動画プレイヤーや説明欄を見ることで、AI生成であることがわかるようになります。

·gigazine.net·Nov 18, 2023

YouTubeがAI生成・改変動画をはっきり明示する方針を発表、クリエイターに情報開示を義務づけ違反するとパートナープログラム停止も

YouTube Premiumが「対話型AI機能」「高画質版の拡大」など新しい特典を発表

YouTubeは2023年11月15日に、YouTube Premiumのユーザー向けにいくつかの新機能を拡張すると発表しました。新機能には、多くのデバイスで高画質設定の「1080p Premium」を使えたり、YouTubeを継続的に使用することで実績バッジを獲得できたりといったものが追加されています。

·gigazine.net·Nov 18, 2023

YouTube Premiumが「対話型AI機能」「高画質版の拡大」など新しい特典を発表

Metaが文章から違和感ゼロの動画を生成するAI「Emu Video」＆文章で指示して画像を編集できるAI「Emu Edit」を発表

Metaが文章から動画を生成できるAI「Emu Video」と文章で指示して画像を編集できるAI「Emu Edit」を2023年11月16日(木)に発表しました。合わせて、両AIで生成できる動画や画像の例を集めたデモサイトも用意されています。

·gigazine.net·Nov 18, 2023

Metaが文章から違和感ゼロの動画を生成するAI「Emu Video」＆文章で指示して画像を編集できるAI「Emu Edit」を発表

画像生成AI「DALL-E」のシステムメッセージが発見され「プロンプトは大文字にした方がいいのか？」などと指摘されてしまう事態に

対話型AIのChatGPTに完全統合された画像生成AI「DALL-E 3」をテストしているユーザーが、ChatGPTとDALL-E 3の間でやりとりされていると思しき内部プロンプトを発見しました。このプロンプトには「Please」という単語や大文字で書かれた文章が見つかったため、「AIに何か指示するときには大文字や丁寧語が有効なのでは？」とのうわさが立ち始めています。

·gigazine.net·Nov 10, 2023

画像生成AI「DALL-E」のシステムメッセージが発見され「プロンプトは大文字にした方がいいのか？」などと指摘されてしまう事態に

顔認識検索エンジン「PimEyes」は子どもの顔の検索をブロックしている

顔認識技術を利用して、ネットで公開されている写真に写っている人のことを検索できるサービス「PimEyes」が、子どものプライバシーへの懸念から、未成年者の被写体の検索試行をブロックしていることがわかりました。ギオルギー・ゴブロニゼCEOは「傷つけない」というPimEyesの基本方針に基づく施策だと説明しています。

·gigazine.net·Nov 10, 2023

顔認識検索エンジン「PimEyes」は子どもの顔の検索をブロックしている

イラスト作品や写真作品を毒化して画像生成AIの学習を阻害できる学習防止ツール「Nightshade」

シカゴ大学の研究チームがAIによる画像学習を防止するツール「Nightshade」を開発しています。Nightshadeを用いて画像を処理すると画像の見た目を大きく変えずにAIによる学習を阻害することが可能とのことです。

·gigazine.net·Nov 10, 2023

イラスト作品や写真作品を毒化して画像生成AIの学習を阻害できる学習防止ツール「Nightshade」

火山灰に埋もれて炭化した古代ローマの巻物を解読したら3000万円がゲットできるチャレンジで最初の単語がついに解読される

火山灰に埋もれた古代ローマの都市から発見された古文書を解読する賞金25万ドル(約3300万円)のコンテスト「ヴェスヴィオ・チャレンジ」が2023年3月15日から始まっています。2023年10月12日には、ついに最初の単語を解読した人物が現れました。

·gigazine.net·Nov 10, 2023

火山灰に埋もれて炭化した古代ローマの巻物を解読したら3000万円がゲットできるチャレンジで最初の単語がついに解読される

Amazonが商品の画像をAIでスタイリッシュにする機能を提供

プロンプトを入力するだけで商品の背景画像を自由に生成できる機能のベータ版をAmazonが提供しました。白背景にぽつんと写った商品の画像などを、実際のライフスタイルに合ったシーンに差し替えることができます。

·gigazine.net·Nov 10, 2023

Amazonが商品の画像をAIでスタイリッシュにする機能を提供

Googleが真偽不明な画像のファクトチェック機能を開発中

SNSやニュースを閲覧していると「これってフェイク画像じゃないかな？」と感じる画像を高頻度で目にします。Googleが開発中の画像ファクトチェック機能を使えば、画像の出どころを調べたり本物の写真か確かめたりすることができます。

·gigazine.net·Nov 10, 2023

Googleが真偽不明な画像のファクトチェック機能を開発中

画像生成AI「Stable Diffusion」や「Midjourney」に自作品の著作権を侵害されたとするアーティストたちの集団訴訟が裁判所によって棄却される

文章や参考画像を入力するだけで好みの画像を生成できる画像生成AIの開発が急速に進んでいますが、画像生成AIには「人間のアーティストの著作権を侵害しているのではないか」という意見も投じられており、著作権に焦点を当てた訴訟が複数展開されています。そんな中、北カリフォルニア地区の裁判所がStable DiffusionやMidjourneyを相手取った集団訴訟を棄却しました。

·gigazine.net·Nov 10, 2023

画像生成AI「Stable Diffusion」や「Midjourney」に自作品の著作権を侵害されたとするアーティストたちの集団訴訟が裁判所によって棄却される

AIが生成した「クラスメイトの女子高生の偽ヌード写真」を男子高生がグループチャットで共有したとして警察が捜査を開始

アメリカ・ニュージャージー州にあるウェストフィールド高等学校の男子生徒らが、AIを使用して同級生の女子生徒のヌード写真を作成し、共有していたことがわかりました。この事件で警察は捜査を進めていますが、問題の画像にアクセスできず、偽のヌード写真の頒布が違法行為にあたるかどうかも不明なため、暗中模索の状況であると伝えられています。

·gigazine.net·Nov 10, 2023

AIが生成した「クラスメイトの女子高生の偽ヌード写真」を男子高生がグループチャットで共有したとして警察が捜査を開始

世界中のあらゆる既知の果物を描いた7500枚の水彩画を1886年にアメリカ政府が依頼、高解像度でダウンロード可能

写真技術が発達した現代では、植物や果物などの記録を撮影して保存することは簡単です。しかし、写真が発達する前の時代では、観察したものを写真として残すことは困難でした。1886年にアメリカ合衆国農務省(USDA)が、リンゴやサクランボ、ブドウ、柿などの果物を水彩画として描くことを数多くのアーティストに依頼しています。

·gigazine.net·Nov 10, 2023

世界中のあらゆる既知の果物を描いた7500枚の水彩画を1886年にアメリカ政府が依頼、高解像度でダウンロード可能

Googleフォトの物体を消したり拡大したりできる「編集マジック」は免許証や領収書では利用不可なことが判明

Pixel 8およびPixel 8 ProのGoogleフォトアプリでは、画像内の物体を削除したり拡大・縮小したりできる「編集マジック」を利用可能です。しかし、免許証など一部の被写体では編集マジックの利用が制限されていることが明らかになりました。

·gigazine.net·Nov 10, 2023

Googleフォトの物体を消したり拡大したりできる「編集マジック」は免許証や領収書では利用不可なことが判明