画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2695 bookmarks
Custom sorting
Alibabaが新AIモデル「Qwen2-VL」をリリース、20分を超えるビデオを分析し内容についての質問に要約して回答可能
Alibabaが新AIモデル「Qwen2-VL」をリリース、20分を超えるビデオを分析し内容についての質問に要約して回答可能
卓越した画像・動画の理解能力を持つというAIモデル「Qwen2-VL」をAlibabaが発表しました。OpenAIの「GPT-4o」やAnthropicの「Claude 3.5-Sonnet」といった他社モデルと比較して上回る点が多くあり、すでに英語と中国語に加えて日本語や韓国語にも対応済み。無料でデモを試すこともできます。
·gigazine.net·
Alibabaが新AIモデル「Qwen2-VL」をリリース、20分を超えるビデオを分析し内容についての質問に要約して回答可能
Google フォトの検索機能がアップデートされ「青い空」などの自然な文章で絞り込み検索可能に
Google フォトの検索機能がアップデートされ「青い空」などの自然な文章で絞り込み検索可能に
Googleの写真管理サービス「Google フォト」には高度な検索機能が搭載されており、「食べ物」「海」「山」といった単語で検索することで膨大な写真ライブラリから目的の写真を探すことが可能です。この検索機能の強化アップデートが2024年9月5日(木)に実施され、自然な文章で条件を細かく指定して絞り込み検索できるようになりました。
·gigazine.net·
Google フォトの検索機能がアップデートされ「青い空」などの自然な文章で絞り込み検索可能に
YouTubeが顔や声を含むクリエイターの肖像のコピーを防ぐAI検出ツールを発表、AIのトレーニングのためのスクレイピングも厳しく批判
YouTubeが顔や声を含むクリエイターの肖像のコピーを防ぐAI検出ツールを発表、AIのトレーニングのためのスクレイピングも厳しく批判
YouTubeが2024年9月5日に、クリエイターが自身の顔や声などの肖像がコピーされてほかの動画で使用されるのを防ぐためのAI検出ツールを発表しました。
·gigazine.net·
YouTubeが顔や声を含むクリエイターの肖像のコピーを防ぐAI検出ツールを発表、AIのトレーニングのためのスクレイピングも厳しく批判
iPhone 16 Proではカメラのアップグレードによりマクロ撮影時にも高画質の写真が撮影できるようになる可能性
iPhone 16 Proではカメラのアップグレードによりマクロ撮影時にも高画質の写真が撮影できるようになる可能性
日本時間の2024年9月10日2時から開催予定のAppleの発表イベントでは、iPhone 16シリーズが発表されると目されています。この中のハイエンドモデルとなるiPhone 16 ProおよびiPhone 16 Pro Maxでは、iPhoneカメラの欠点のひとつがついに改善される可能性があると9to5Macが報じました。
·gigazine.net·
iPhone 16 Proではカメラのアップグレードによりマクロ撮影時にも高画質の写真が撮影できるようになる可能性
YouTubeが「特定の体重や見た目を理想化する動画」を未成年ユーザーのおすすめに表示しないと宣言
YouTubeが「特定の体重や見た目を理想化する動画」を未成年ユーザーのおすすめに表示しないと宣言
体重や外見の理想をうたう動画を繰り返し視聴すると有害になる可能性があるという専門家からの警告を受けて、YouTubeがそのような動画を10代のユーザーにおすすめ表示することをやめると発表しました。
·gigazine.net·
YouTubeが「特定の体重や見た目を理想化する動画」を未成年ユーザーのおすすめに表示しないと宣言
スーパーマリオのプレイ映像を学習してテキストからゲーム動画を自動生成するAIモデル「MarioVGG」
スーパーマリオのプレイ映像を学習してテキストからゲーム動画を自動生成するAIモデル「MarioVGG」
AI開発スタートアップのVirtuals Protocolが、テキストを入力することで「スーパーマリオブラザーズ」のゲームプレイ映像を生成できるAIモデル「MarioVGG」を開発したと発表しました。MarioVGGは約73万フレームに及ぶ「スーパーマリオブラザーズ」のゲームプレイ動画で学習しています。
·gigazine.net·
スーパーマリオのプレイ映像を学習してテキストからゲーム動画を自動生成するAIモデル「MarioVGG」
Stable Diffusionにも使われるデータセット「LAION-5B」に児童性的虐待コンテンツが見つかり開発元がリンクを削除した「Re-LAION-5B」をリリース
Stable Diffusionにも使われるデータセット「LAION-5B」に児童性的虐待コンテンツが見つかり開発元がリンクを削除した「Re-LAION-5B」をリリース
Stable DiffusionやMidjourneyなど著名な画像生成AIにも使われたデータセット「LAION-5B」に児童性的虐待コンテンツ(CSAM)が見つかった問題で、LAION-5Bの開発元であるLAIONがデータセットからCSAMを削除した「Re-LAION-5B」を新たに発表しました。
·gigazine.net·
Stable Diffusionにも使われるデータセット「LAION-5B」に児童性的虐待コンテンツが見つかり開発元がリンクを削除した「Re-LAION-5B」をリリース
Pixel 9に搭載された画像生成AIはフェイク画像を作るのが簡単すぎて写真を信じられなくなるレベルでした
Pixel 9に搭載された画像生成AIはフェイク画像を作るのが簡単すぎて写真を信じられなくなるレベルでした
「Pixel 9」「Pixel 9 Pro」「Pixel 9 Pro XL」には、写真に新たな物体を追加したり写真の一部を置き換えたりできるAI機能「イマジネーション」が搭載されています。スマートフォンに標準搭載された画像生成AI機能でどんな編集が可能なのか気になったので、実際に複数の写真でイマジネーションを実行してみました。
·gigazine.net·
Pixel 9に搭載された画像生成AIはフェイク画像を作るのが簡単すぎて写真を信じられなくなるレベルでした
Pixelの「あとから写真をズームできる機能」を使ってみた
Pixelの「あとから写真をズームできる機能」を使ってみた
スマートフォンで撮影した写真を鑑賞していると「もっとズームで撮影しておけばよかった」と感じることがありますが、撮影済みの写真を拡大しても画質が低下してしまいます。Google製スマートフォン「Pixel」の一部の機種に搭載された「ズーム画質向上」という機能を使えば撮影済み写真をキレイに拡大できるらしいので、実際に使ってみましたた。
·gigazine.net·
Pixelの「あとから写真をズームできる機能」を使ってみた
カマラ・ハリス陣営が投稿した集会写真はAI生成の偽画像とドナルド・トランプが主張し「これが民主党が選挙で勝つ方法」と痛烈に批判、しかし実際の写真である証拠が続々集まる
カマラ・ハリス陣営が投稿した集会写真はAI生成の偽画像とドナルド・トランプが主張し「これが民主党が選挙で勝つ方法」と痛烈に批判、しかし実際の写真である証拠が続々集まる
アメリカの第49代副大統領で、2024年アメリカ合衆国大統領選挙からの撤退を表明したジョー・バイデン大統領の後任候補として民主党の指名候補となったのがカマラ・ハリス氏です。同氏はすでに各地で選挙資金集めのための集会を開催しており、地元であるサンフランシスコでは総額1200万ドル(約17億7000万円)以上を集めたと報じられている通り、大統領選挙に向けて着々と準備を進めています。しかし、ハリス氏が各地で開催している集会の写真は「AIで作成された偽画像である」と、共和党の指名候補であるドナルド・トランプ前大統領が主張していることが明らかになりました。
·gigazine.net·
カマラ・ハリス陣営が投稿した集会写真はAI生成の偽画像とドナルド・トランプが主張し「これが民主党が選挙で勝つ方法」と痛烈に批判、しかし実際の写真である証拠が続々集まる
Xに画像生成AIが搭載され「喫煙するエルモ」「戦車に乗るカマラ・ハリス」など大量のセンシティブ画像が世に放たれる
Xに画像生成AIが搭載され「喫煙するエルモ」「戦車に乗るカマラ・ハリス」など大量のセンシティブ画像が世に放たれる
X(旧Twitter)にはチャットAI「Grok」が搭載されています。このGrokのバージョンアップ版である「Grok-2」のベータテストが2024年8月13日(火)に始まりました。Grok-2には画像生成機能も搭載されており、X上で画像を生成することができます。
·gigazine.net·
Xに画像生成AIが搭載され「喫煙するエルモ」「戦車に乗るカマラ・ハリス」など大量のセンシティブ画像が世に放たれる
ディープフェイク詐欺動画の約25%にイーロン・マスクが登場していたことが判明
ディープフェイク詐欺動画の約25%にイーロン・マスクが登場していたことが判明
AIの発展と普及により、実在する人物にそっくりな顔や声で話すディープフェイク動画を誰でも容易に作成できるようになり、それに伴ってディープフェイク動画の詐欺も急増しています。日刊紙のニューヨーク・タイムズは、インターネット上にあふれているディープフェイク詐欺動画の中でも、特にテスラやSpaceXのCEOを務めるイーロン・マスク氏を登場させたものが多いことを報じました。
·gigazine.net·
ディープフェイク詐欺動画の約25%にイーロン・マスクが登場していたことが判明
Googleが高品質で文字のレンダリングも可能な画像生成モデル「Imagen 3」をリリースしたので使ってみた
Googleが高品質で文字のレンダリングも可能な画像生成モデル「Imagen 3」をリリースしたので使ってみた
Google DeepMindがテキストから画像を生成できる新たなモデル「Imagen 3」をリリースするとともにImagen 3の研究論文を公開しました。Imagen 3はGoogleの画像生成ツール「ImageFX」で試せるとのことなので、実際に試してみました。
·gigazine.net·
Googleが高品質で文字のレンダリングも可能な画像生成モデル「Imagen 3」をリリースしたので使ってみた
Runwayが動画生成AIの「Gen-3 Alpha Turbo」をリリース、Gen-3 Alphaよりも高速かつ安価&5秒と10秒の動画生成&無料トライアル含むすべてのプランで利用可能
Runwayが動画生成AIの「Gen-3 Alpha Turbo」をリリース、Gen-3 Alphaよりも高速かつ安価&5秒と10秒の動画生成&無料トライアル含むすべてのプランで利用可能
AI企業のRunwayが、画像から動画を生成する「Gen-3 Alpha Turbo」をリリースしました。無料トライアルを含むすべてのプランで利用できることが特徴で、既に発表済みの「Gen-3 Alpha」より安価ながら同等のパフォーマンスを発揮するとされています。
·gigazine.net·
Runwayが動画生成AIの「Gen-3 Alpha Turbo」をリリース、Gen-3 Alphaよりも高速かつ安価&5秒と10秒の動画生成&無料トライアル含むすべてのプランで利用可能
YouTuberが生成AIのモデル学習に用いたとしてNVIDIAとOpenAIを提訴、著作権侵害ではなく「不当利得」を主張
YouTuberが生成AIのモデル学習に用いたとしてNVIDIAとOpenAIを提訴、著作権侵害ではなく「不当利得」を主張
YouTuberとして活動しているデビッド・ミレット氏が、コンテンツをAIのトレーニングに利用されているとしてNVIDIAを相手取り集団訴訟を起こしています。ミレット氏はこの2週間前にOpenAIのことも訴えています。
·gigazine.net·
YouTuberが生成AIのモデル学習に用いたとしてNVIDIAとOpenAIを提訴、著作権侵害ではなく「不当利得」を主張
ドナルド・トランプが「テイラー・スウィフトがトランプ支持者である」とする生成AIによる虚偽の画像を共有
ドナルド・トランプが「テイラー・スウィフトがトランプ支持者である」とする生成AIによる虚偽の画像を共有
2024年に開催されるアメリカ大統領選挙で共和党候補として出馬する予定のドナルド・トランプ氏が、自身のメディア会社が所有するSNS「Truth Social」に、「歌手のテイラー・スウィフト氏とそのファンがトランプ氏を支持しているように思わせる画像」を共有しました。しかし、これらの画像がAIで生成されたものだったため、物議を醸しています。
·gigazine.net·
ドナルド・トランプが「テイラー・スウィフトがトランプ支持者である」とする生成AIによる虚偽の画像を共有
Samsungが視線追跡技術を使ってメガネなしで3D映像を楽しめるゲーミングモニター「Odyssey 3D」を発表、2024年内にリリース予定
Samsungが視線追跡技術を使ってメガネなしで3D映像を楽しめるゲーミングモニター「Odyssey 3D」を発表、2024年内にリリース予定
ドイツ・ケルンで2024年8月21日から開催されているゲームイベント「Gamescom 2024」において、Samsungが視線追跡技術を用いることでメガネなしで3D映像を楽しめるゲーミングモニター「Odyssey 3D」を発表しました。
·gigazine.net·
Samsungが視線追跡技術を使ってメガネなしで3D映像を楽しめるゲーミングモニター「Odyssey 3D」を発表、2024年内にリリース予定
本物の写真とAI生成の偽物を識別できる「C2PA」がなかなか普及しないのはなぜか?
本物の写真とAI生成の偽物を識別できる「C2PA」がなかなか普及しないのはなぜか?
スマートフォンひとつで本物と見まごうようなAI画像が作れるようになるにつれて、本物の写真とAIによる偽物を区別する方法の必要性が急激に高まっています。そうした取り組みの代表的なものに、コンテンツの来歴を証明する技術である「C2PA」がありますが、その普及が遅々として進んでいない現状について、IT系ニュースサイトのThe Vergeが論じました。
·gigazine.net·
本物の写真とAI生成の偽物を識別できる「C2PA」がなかなか普及しないのはなぜか?
スマホのAI写真編集機能により「写真が現実を捉えているという基本的な仮定が崩れ去りつつある」との指摘
スマホのAI写真編集機能により「写真が現実を捉えているという基本的な仮定が崩れ去りつつある」との指摘
2024年8月22日、GoogleがフラグシップスマートフォンのPixel 9シリーズをリリースしました。GoogleはPixel 9シリーズにおいて独自のAI機能をセールスポイントのひとつとしていますが、AI写真編集機能の「Magic Editor(編集マジック)」に搭載されているReimagineツールが、「写真が現実を捉えているという基本的な仮定を崩しつつある」とテクノロジーメディアのThe Vergeが指摘しています。
·gigazine.net·
スマホのAI写真編集機能により「写真が現実を捉えているという基本的な仮定が崩れ去りつつある」との指摘
トランプ暗殺未遂事件の写真のインパクトが強い理由をデザインの専門家が解説
トランプ暗殺未遂事件の写真のインパクトが強い理由をデザインの専門家が解説
2024年7月13日に発生したドナルド・トランプ暗殺未遂事件の報道では、負傷したトランプ氏がシークレットサービスに囲まれながら右手の拳を突き上げる写真が大きく取り上げられました。この写真が見る人に強い印象を与える理由を、オーストラリア・シドニー工科大学デザイン学部で写真を教えているサラ・オスカー氏がまとめました。
·gigazine.net·
トランプ暗殺未遂事件の写真のインパクトが強い理由をデザインの専門家が解説
AI学習にYouTubeの字幕を使用したとの報道にAppleが「Apple Intelligence」を含む製品版AIには使っていないと反論
AI学習にYouTubeの字幕を使用したとの報道にAppleが「Apple Intelligence」を含む製品版AIには使っていないと反論
非営利の研究団体が作成したAI学習用のデータセット「The Pile」にYouTubeの字幕が含まれていたことを受け、このデータセットを使用したとされるAppleやNVIDIAが非難されました。これに対し、Appleは「研究用の言語モデルに使用したが、AppleのAI機能であるApple Intelligenceには使用していない」と反論しました。
·gigazine.net·
AI学習にYouTubeの字幕を使用したとの報道にAppleが「Apple Intelligence」を含む製品版AIには使っていないと反論
OpenAIが無料で使えるAIモデル「GPT-4o mini」をリリース、マルチモーダルで画像や音声入力にも対応
OpenAIが無料で使えるAIモデル「GPT-4o mini」をリリース、マルチモーダルで画像や音声入力にも対応
OpenAIが2024年7月18日に、コスト効率に優れた小型モデルの「GPT-4o mini」を発表しました。低コストでありながら、一部のベンチマークでGPT-4を上回るスコアを示したGPT-4o miniは、GPT-3.5の後継として無料ユーザーとChatGPT Plusのユーザーに提供が開始されています。
·gigazine.net·
OpenAIが無料で使えるAIモデル「GPT-4o mini」をリリース、マルチモーダルで画像や音声入力にも対応
EAがAIを使ってわずか3カ月で1万1000人分の大学アメフト選手をスキャンしてゲームに実装することに成功
EAがAIを使ってわずか3カ月で1万1000人分の大学アメフト選手をスキャンしてゲームに実装することに成功
アメリカのカレッジフットボールを題材としたエレクトロニック・アーツ(EA)の最新ゲーム「EA SPORTS College Football 25」では、AIを用いて1万1000人の大学生を3Dスキャンし、3Dモデルが作成されています。
·gigazine.net·
EAがAIを使ってわずか3カ月で1万1000人分の大学アメフト選手をスキャンしてゲームに実装することに成功
天文学者が銀河測定ツールを使ってAIが作成したディープフェイクを見分ける手法を発明
天文学者が銀河測定ツールを使ってAIが作成したディープフェイクを見分ける手法を発明
生成AIの普及に伴いAIを用いて作成された偽画像(ディープフェイク)を見分ける手法が求められるようになっています。イングランド・ハル大学の研究チームは、銀河の測定に使用するツールを利用してディープフェイクを見分ける手法を開発しました。
·gigazine.net·
天文学者が銀河測定ツールを使ってAIが作成したディープフェイクを見分ける手法を発明
Runwayの動画生成AIは写真系YouTuberの動画をスクレイピングしてトレーニングされたものと指摘される
Runwayの動画生成AIは写真系YouTuberの動画をスクレイピングしてトレーニングされたものと指摘される
AI企業のRunwayが2024年6月に発表した動画生成AIモデルの「Gen-3 Alpha」は、写真系YouTuberの動画をスクレイピングしてトレーニングされた可能性があることが404 Mediaの調査により明らかになりました。
·gigazine.net·
Runwayの動画生成AIは写真系YouTuberの動画をスクレイピングしてトレーニングされたものと指摘される