画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2306 bookmarks
Custom sorting
1枚の画像からアニメを作れる動画生成AIアプリ「Animai」をStable Diffusion開発元が公開したので使ってみた
1枚の画像からアニメを作れる動画生成AIアプリ「Animai」をStable Diffusion開発元が公開したので使ってみた
画像生成AI「Stable Diffusion」の開発元である「Stability AI」が、アニメーション生成AIアプリ「Animai」を発表しました。Animaiは画像コレクションサービスを展開する「Revel.xyz」と共同開発されたアプリで、記事作成時点では誰でも無料で使用可能です。一体どんなアニメーションを生成できるのか気になったので、実際に使ってみました。
·gigazine.net·
1枚の画像からアニメを作れる動画生成AIアプリ「Animai」をStable Diffusion開発元が公開したので使ってみた
専用の機材不要、iPhoneだけで撮影した映像をわずか数分でまったく別の顔に置き換えるEpic Gamesの「MetaHuman Animator」のデモ映像がすごい
専用の機材不要、iPhoneだけで撮影した映像をわずか数分でまったく別の顔に置き換えるEpic Gamesの「MetaHuman Animator」のデモ映像がすごい
演者の顔を3DCG化するフェイシャルキャプチャはゲーム業界などで広く使われていますが、特殊なハードウェアが必要だったり、コンピューター処理とアーティストの手作業による微調整を要したりするため、小規模なスタジオがこれを行うのは簡単なことではありません。このような労力と時間のかかるワークフローに革命をもたらす新ツール「MetaHuman Animator」をEpic Gamesが新たに開発し、デモ映像を公開しました。
·gigazine.net·
専用の機材不要、iPhoneだけで撮影した映像をわずか数分でまったく別の顔に置き換えるEpic Gamesの「MetaHuman Animator」のデモ映像がすごい
AI製のディープフェイクポルノ動画がGoogle検索でヒットするサイトで売買されている、有名人だけでなく一般人も標的に
AI製のディープフェイクポルノ動画がGoogle検索でヒットするサイトで売買されている、有名人だけでなく一般人も標的に
高精度な画像合成AIの登場によって浮上した問題の1つが、他人の顔を無断で使用するディープフェイクポルノです。NBCニュースが、「Google検索で簡単に見つけられるウェブサイトに大量のディープフェイク動画が投稿されており、有名人だけでなく一般人を標的にしたディープフェイクの作成を請け負うビジネスも存在する」と報じています。
·gigazine.net·
AI製のディープフェイクポルノ動画がGoogle検索でヒットするサイトで売買されている、有名人だけでなく一般人も標的に
画像と文字を扱うマルチモーダルモデルがオープンソースの「OpenFlamingo」として登場、無料で使えるデモも公開中
画像と文字を扱うマルチモーダルモデルがオープンソースの「OpenFlamingo」として登場、無料で使えるデモも公開中
DeepMindのマルチモーダルモデル「Flamingo」をオープンソースで再現したフレームワーク「OpenFlamingo」がリリースされました。これにより、ユーザーが手軽にテキストと画像を含む大規模なコーパスを利用できるようになります。
·gigazine.net·
画像と文字を扱うマルチモーダルモデルがオープンソースの「OpenFlamingo」として登場、無料で使えるデモも公開中
無料で使えるムービー生成AI「Text2Video-Zero」が登場したので実際に使ってサクッとムービーを作ってみた
無料で使えるムービー生成AI「Text2Video-Zero」が登場したので実際に使ってサクッとムービーを作ってみた
2023年3月25日に、ムービー生成AI「Text2Video-Zero」のデモアプリが公開されました。Text2Video-Zeroを使えば文章を入力するだけで数秒間のムービーをサクッと生成できるとのことなので、実際にどんなムービーを生成できるのか試してみました。
·gigazine.net·
無料で使えるムービー生成AI「Text2Video-Zero」が登場したので実際に使ってサクッとムービーを作ってみた
GIGAZINE(ギガジン)
GIGAZINE(ギガジン)
日々のあらゆるシーンで役立つ情報を提供するIT系ニュースサイト。毎日更新中。
·gigazine.net·
GIGAZINE(ギガジン)
たった1枚の画像から別視点の画像を生成するAIモデル「Zero-1-to-3」をトヨタ・リサーチ・インスティテュートなどの研究チームが開発
たった1枚の画像から別視点の画像を生成するAIモデル「Zero-1-to-3」をトヨタ・リサーチ・インスティテュートなどの研究チームが開発
オブジェクトの画像を1枚入力するだけで、視点を変えた高精度の画像を生成できるAIモデル「Zero-1-to-3」を、アメリカのコロンビア大学やトヨタ自動車の研究機関であるトヨタ・リサーチ・インスティテュートの研究チームが開発しました。実際にZero-1-to-3がどれほどの性能を持っているのかを試せるデモページも公開されています。
·gigazine.net·
たった1枚の画像から別視点の画像を生成するAIモデル「Zero-1-to-3」をトヨタ・リサーチ・インスティテュートなどの研究チームが開発
画像生成AI「Midjourney V5」を利用して偽の「トランプ前大統領が逮捕された」画像を生成した人物が利用禁止処分を受ける
画像生成AI「Midjourney V5」を利用して偽の「トランプ前大統領が逮捕された」画像を生成した人物が利用禁止処分を受ける
画像生成AI「MidJourney」の開発チームが、2023年3月16日にリリースした「Midjourney V5」はまるで実写のような超高画質の画像を生成することが可能です。そんなMidjourney V5を利用して「ドナルド・トランプ前アメリカ大統領が逮捕された」という偽の画像を大量に生成し、Twitterで公開したユーザーがMidjourneyから利用禁止処分を受けたことが明らかになりました。
·gigazine.net·
画像生成AI「Midjourney V5」を利用して偽の「トランプ前大統領が逮捕された」画像を生成した人物が利用禁止処分を受ける
AIにテキストを入力するだけで3Dの部屋が自動的に生成できる「Text2Room」が開発される
AIにテキストを入力するだけで3Dの部屋が自動的に生成できる「Text2Room」が開発される
AIの発展により、これまでテキストを入力するだけで3Dモデルや動画、家の画像などを生成してくれるサイトやツールが数多く開発されています。新たに、テキストを入力するだけで自動的に家具や雑貨を含めた3Dの部屋を生成することができる「Text2Room」がGitHubで公開されています。
·gigazine.net·
AIにテキストを入力するだけで3Dの部屋が自動的に生成できる「Text2Room」が開発される
4Kウェブカメラ「Insta360 Link」の「被写体が動いても中心に映し続ける機能」の有効化方法4種をすべて試してみた
4Kウェブカメラ「Insta360 Link」の「被写体が動いても中心に映し続ける機能」の有効化方法4種をすべて試してみた
4Kウェブカメラ「Insta360 Link」は、ジンバルを搭載することで「被写体が動き回っても顔を撮影し続ける」という動作を可能としています。そんな強力追跡機能には4種類もの起動方法が用意されているので、実際に4種の方法で追跡機能を使ってみました。
·gigazine.net·
4Kウェブカメラ「Insta360 Link」の「被写体が動いても中心に映し続ける機能」の有効化方法4種をすべて試してみた
Adobeが独自のジェネレーティブAI「Firefly」を発表、PhotoshopやIllustratorといったCreative Cloudへの統合も
Adobeが独自のジェネレーティブAI「Firefly」を発表、PhotoshopやIllustratorといったCreative Cloudへの統合も
2023年3月21日、IllustratorやPhotoshopといったクリエイティブツールでおなじみのAdobeが、独自の画像生成機能およびテキストエフェクトを提供できるジェネレーティブAI「Firefly」を発表しました。Fireflyは将来的にAdobe Creative Cloudに統合され、コンテンツの作成・修正に、さらなる精度・パワー・スピード・手軽さをもたらしてくれます。
·gigazine.net·
Adobeが独自のジェネレーティブAI「Firefly」を発表、PhotoshopやIllustratorといったCreative Cloudへの統合も
新しいBingに画像生成AI「DALL・E」による画像生成機能「Bing Image Creator」追加
新しいBingに画像生成AI「DALL・E」による画像生成機能「Bing Image Creator」追加
Microsoftは2023年2月に、検索用にカスタマイズしたチャットAI「GPT-4」で動作する「新しいBing」を発表しましたが、さらにBing Chatに画像生成AI「DALL・E」を搭載した「Bing Image Creator」が追加されたことが明らかになりました。
·gigazine.net·
新しいBingに画像生成AI「DALL・E」による画像生成機能「Bing Image Creator」追加
画面を動かしても水平状態を保って顔を映し続けるジンバル搭載ウェブカメラ「Insta360 Link」レビュー
画面を動かしても水平状態を保って顔を映し続けるジンバル搭載ウェブカメラ「Insta360 Link」レビュー
ジンバル搭載4Kウェブカメラ「Insta360 Link」が2022年8月に登場しました。Insta360 Linkは、被写体自動追尾機能を使って歩き回りながらプレゼンしたり、ホワイトボードをクッキリ明瞭にクロップしたりといったプレゼンやオンラインセミナーに役立つ機能を数多く備えています。そんなInsta360 Linkが編集部に届いたので、外観チェックに続いてPCとの接続手順や画質、ピント合わせ性能を確かめてみました。
·gigazine.net·
画面を動かしても水平状態を保って顔を映し続けるジンバル搭載ウェブカメラ「Insta360 Link」レビュー
画像から「似た画像」を無限生成できるStability AI公式ウェブアプリ「Stable diffusion reimagine」使ってみたよレビュー
画像から「似た画像」を無限生成できるStability AI公式ウェブアプリ「Stable diffusion reimagine」使ってみたよレビュー
画像生成AI「Stable diffusion」の開発元であるStability AIが、参考画像を指定するだけで「参考画像に似た画像」を生成してくれるサービス「Stable diffusion reimagine」をリリースしました。記事作成時点では一部機能を無料で使用可能だったので、実際に使ってどんな画像を生成できるのか試してみました。
·gigazine.net·
画像から「似た画像」を無限生成できるStability AI公式ウェブアプリ「Stable diffusion reimagine」使ってみたよレビュー
オリジナルのアートに目に見えない改変を加えてAIによる学習を防ぐツール「Glaze」が公開
オリジナルのアートに目に見えない改変を加えてAIによる学習を防ぐツール「Glaze」が公開
「Stable Diffusion」や「Midjourney」をはじめとする画像生成AIは入力したキーワードに沿って適切な画像を生成することができますが、一方でAIの学習には人間が描いたイラストや絵画などが使用されることもあり、著作権侵害が問題となっています。そんな中、シカゴ大学の研究チームが、人間が描いた絵画を分析し、ほとんど目に見えない改変を加えることでAIによる学習から保護するためのツールである「Glaze」を発表しました。
·gigazine.net·
オリジナルのアートに目に見えない改変を加えてAIによる学習を防ぐツール「Glaze」が公開
カメラで解析してコンピューターが作業する「コンピュータービジョン」が2023年の製造業をどう変えているのか?
カメラで解析してコンピューターが作業する「コンピュータービジョン」が2023年の製造業をどう変えているのか?
カメラによる動画解析やセンサーを用いた3次元画像処理など、コンピューターにデジタルな画像や動画を理解させてさまざまな処理を行わせる研究分野を「コンピュータービジョン」といいます。このコンピュータービジョンを取り入れたシステムを開発する企業・Voxel51が、コンピュータービジョンが製造業で応用されるケースについて語っています。
·gigazine.net·
カメラで解析してコンピューターが作業する「コンピュータービジョン」が2023年の製造業をどう変えているのか?
画像生成AIでも使われるAIライブラリ「PyTorch」のメジャーアップデート版「PyTorch 2.0」正式リリース
画像生成AIでも使われるAIライブラリ「PyTorch」のメジャーアップデート版「PyTorch 2.0」正式リリース
画像生成AI「Stable Diffusion」などの有名AIでも利用されているPython向け機械学習ライブラリ「PyTorch」のバージョン2.0が正式リリースされました。PyTorch 2.0は後方互換性を保ちつつ、処理速度が大幅に向上しています。
·gigazine.net·
画像生成AIでも使われるAIライブラリ「PyTorch」のメジャーアップデート版「PyTorch 2.0」正式リリース
画像生成AI「Midjourney V5」登場、超高画質&AIが苦手な「手」もキレイで実写との区別はほぼ不可能
画像生成AI「Midjourney V5」登場、超高画質&AIが苦手な「手」もキレイで実写との区別はほぼ不可能
画像生成AI「Midjourney」の開発チームが、2023年3月16日(木)に「Midjourney V5」のアルファ版をリリースしました。「Midjourney V5」では超高画質な画像生成が可能となっているだけでなく、画像生成AIの課題であった「『手』を正確に描写できない問題」が解決されたという報告も寄せられています。
·gigazine.net·
画像生成AI「Midjourney V5」登場、超高画質&AIが苦手な「手」もキレイで実写との区別はほぼ不可能
AIが生成した絵や文章に著作権は認められるのか?アメリカ著作権局がガイダンスを発表
AIが生成した絵や文章に著作権は認められるのか?アメリカ著作権局がガイダンスを発表
OpenAIの大規模言語モデル・GPT-4や画像生成AIのMidjourneyなどのジェネレーティブAI技術は急速に発展し、実際に文章や絵画を作成するケースが爆発的に増えています。アメリカ著作権局が2023年3月16日付けで、AIが生成した素材を著作物として認める場合を明確にするガイダンスを発表しました。
·gigazine.net·
AIが生成した絵や文章に著作権は認められるのか?アメリカ著作権局がガイダンスを発表
画像生成AIのStable Diffusionをインストール不要でブラウザから動作可能な「Web Stable Difusion」が登場
画像生成AIのStable Diffusionをインストール不要でブラウザから動作可能な「Web Stable Difusion」が登場
画像生成AIのStable Diffusionを動かすには十分な性能のGPUとVRAMが求められるため、ハイスペックなPCやワークステーションを使うか、あるいはGPUサーバーにアクセスして演算リソースを借りる必要があります。エンジニア向けに機械学習の講義を配信しているMachine Learning Compilationが、サーバーのサポートを必要とせずにブラウザ内でStable Diffusionを実行できる「Web Stable Diffusion」を公開しています。
·gigazine.net·
画像生成AIのStable Diffusionをインストール不要でブラウザから動作可能な「Web Stable Difusion」が登場
「暗くなってしまったムービー」をGoogleフォトの「HDR」で一発補正する方法、AndroidスマホでもiPhoneでもOK
「暗くなってしまったムービー」をGoogleフォトの「HDR」で一発補正する方法、AndroidスマホでもiPhoneでもOK
スマートフォンやカメラでムービーを撮影した際に「明暗差の激しいシーンで、一部分が暗くなってしまった」という経験がある人は多いはず。Googleフォトには明暗差の激しい写真を見栄え良く編集するツール「HDR」が搭載されているのですが、新たに「HDR」をムービーでも使えるようになったので、実際に使う手順や効果を確かめてみました。
·gigazine.net·
「暗くなってしまったムービー」をGoogleフォトの「HDR」で一発補正する方法、AndroidスマホでもiPhoneでもOK
Googleが視覚とテキストから人間のように理解するロボット向け言語モデル「PaLM-E」を発表、「お菓子を持ってこい」などの複雑な命令も遂行可能
Googleが視覚とテキストから人間のように理解するロボット向け言語モデル「PaLM-E」を発表、「お菓子を持ってこい」などの複雑な命令も遂行可能
対話型AI「ChatGPT」などに使われる言語モデルは複雑なタスクを実行することが実証されていますが、これをロボットに応用する場合、状況にあった動作を行うために言語モデルはより詳しい情報を収集する必要があります。Googleとベルリン工科大学のAI研究者グループは、カメラで捉えた映像とテキストによる指示を理解できる新しい言語モデル「PaLM-E」を開発したことを明らかにしました。このモデルを使うことにより、「引き出しからお菓子を持ってきて」というような複雑な命令をロボットが処理できるようになります。
·gigazine.net·
Googleが視覚とテキストから人間のように理解するロボット向け言語モデル「PaLM-E」を発表、「お菓子を持ってこい」などの複雑な命令も遂行可能
実写なのにCG画像にしか見えない写真たち
実写なのにCG画像にしか見えない写真たち
どこからどう見てもコンピューターで作った3DCG画像にしか見えない写真4枚とその撮影工程を、ノルウェーに拠点を置くデザインスタジオ「Skrekkøgle」が公開しています。
·gigazine.net·
実写なのにCG画像にしか見えない写真たち
ChatGPTに画像生成機能を搭載してチャット形式で画像生成可能な「Visual ChatGPT」をMicrosoftが開発
ChatGPTに画像生成機能を搭載してチャット形式で画像生成可能な「Visual ChatGPT」をMicrosoftが開発
OpenAIが提供する対話型AI「ChatGPT」は非常に高い性能から裁判での使用や文章の執筆などで用いられています。しかし、ChatGPTは会話用に開発されたAIであり、画像生成機能は搭載されていません。そんな中、新たにマイクロソフトリサーチアジアのチェンフェイ・ウー氏らの研究チームがChatGPTに画像生成機能を搭載した「Visual ChatGPT」を発表しました。
·gigazine.net·
ChatGPTに画像生成機能を搭載してチャット形式で画像生成可能な「Visual ChatGPT」をMicrosoftが開発
エクサウィザーズと戸田建設、現場管理者が短時間で 安全点検できる動画ダイジェストシステムを共同開発 〜 AIが重要シーンを抽出、安全管理水準を維持し動画視聴時間を約9割削減 〜 - 株式会社エクサウィザーズ
エクサウィザーズと戸田建設、現場管理者が短時間で 安全点検できる動画ダイジェストシステムを共同開発 〜 AIが重要シーンを抽出、安全管理水準を維持し動画視聴時間を約9割削減 〜 - 株式会社エクサウィザーズ
AIを利活用したサービスによる社会課題解決に取り組む株式会社エクサウィザーズ(東京都港区、代表取締役社長:石山 洸、以下、エクサウィザーズ)は、戸田建設株式会社(東京都中央区、代表取締役社長:大谷 清介、以下戸田建設) […]
·exawizards.com·
エクサウィザーズと戸田建設、現場管理者が短時間で 安全点検できる動画ダイジェストシステムを共同開発 〜 AIが重要シーンを抽出、安全管理水準を維持し動画視聴時間を約9割削減 〜 - 株式会社エクサウィザーズ
Samsungが「AIが描画した偽の月の写真」はどのように撮影されているのかをブログで公開
Samsungが「AIが描画した偽の月の写真」はどのように撮影されているのかをブログで公開
Samsungのハイエンドスマートフォンには、最大100倍のズーム写真が撮影可能な「スペースズーム」機能が搭載されています。このスペースズーム機能を使って撮影した月の写真が「ほとんどはAI処理によって描画されたものだ」と指摘された件について、Samsungが英語版ブログに技術的詳細を投稿しました。
·gigazine.net·
Samsungが「AIが描画した偽の月の写真」はどのように撮影されているのかをブログで公開
やっぱり萌えイラストを錬成したい ~あなたが欲しい絵を生成できるサービスはこれだ!【いまからでも遅くない!ツールとして使うAI画像生成】
やっぱり萌えイラストを錬成したい ~あなたが欲しい絵を生成できるサービスはこれだ!【いまからでも遅くない!ツールとして使うAI画像生成】
「Stable Diffusion」をはじめとするAI画像生成は、最近非常に注目を集めている分野です。
·forest.watch.impress.co.jp·
やっぱり萌えイラストを錬成したい ~あなたが欲しい絵を生成できるサービスはこれだ!【いまからでも遅くない!ツールとして使うAI画像生成】