画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2286 bookmarks
Custom sorting
高機能フォトグラメトリーソフトが“無料”に Epic Games、「RealityCapture 1.4」公開
高機能フォトグラメトリーソフトが“無料”に Epic Games、「RealityCapture 1.4」公開
米Epic Gamesは4月23日(現地時間)、複数の画像やレーザースキャンデータをもとに、現実空間を3D空間上に構築するフォトグラメトリ(写真測量)ソフト「Reality Capture 1.4」を公開した。以前のバージョンからプラン体系を刷新、年間収益が100万ドルを超えない個人・法人なら無料で使えるようになった。
·itmedia.co.jp·
高機能フォトグラメトリーソフトが“無料”に Epic Games、「RealityCapture 1.4」公開
生成AIに国際枠組み、岸田首相が創設表明へ…発信者明示技術の推進を支援
生成AIに国際枠組み、岸田首相が創設表明へ…発信者明示技術の推進を支援
【読売新聞】 岸田首相は、5月上旬に開かれる経済協力開発機構(OECD)の会合で、生成AI(人工知能)の規律と活用の両立に向けた国際枠組みの創設を表明する。40か国以上の参加を見込んでおり、日本として国際ルール作りを主導する狙いがあ
·yomiuri.co.jp·
生成AIに国際枠組み、岸田首相が創設表明へ…発信者明示技術の推進を支援
話題のAIベンチャー「Sakana AI」が画像生成AIを公開 “自律進化”技術で、推論速度が約10倍高速に
話題のAIベンチャー「Sakana AI」が画像生成AIを公開 “自律進化”技術で、推論速度が約10倍高速に
AIベンチャーのSakana AIは、画像生成AI「EvoSDXL-JP」を公開した。同社が提案する生成AIの開発手法「進化的モデルマージ」によって構築したAIモデルで、従来の日本語AIモデルと比べて10倍速く画像を生成できるという。
·itmedia.co.jp·
話題のAIベンチャー「Sakana AI」が画像生成AIを公開 “自律進化”技術で、推論速度が約10倍高速に
AIの需要増加によりデータセンターの消費電力が爆増してAI開発のボトルネックになっている
AIの需要増加によりデータセンターの消費電力が爆増してAI開発のボトルネックになっている
近年は大手テクノロジー企業が生成AIツールの開発に多額の投資を行っており、AI用データセンターの建築プロジェクトが世界各国で進められています。ところが、AIバブルによってデータセンターの消費電力が急激に増加しており、電力供給の問題がAIの成長を脅かすボトルネックになっていると経済紙のフィナンシャル・タイムズが報じています。
·gigazine.net·
AIの需要増加によりデータセンターの消費電力が爆増してAI開発のボトルネックになっている
Adobe Premiere Proに生成AIで「映像内のオブジェクト追加・削除」「フレームの追加」「映像素材の生成」を実行する機能が2024年中に搭載される予定
Adobe Premiere Proに生成AIで「映像内のオブジェクト追加・削除」「フレームの追加」「映像素材の生成」を実行する機能が2024年中に搭載される予定
Adobeが動画編集ソフトのPremiere Proに「生成AIを活用した新機能」を2024年中に導入すると発表しました。Adobeの生成AIであるFireflyのVideo Modelに加えて、OpenAIのSoraやRunwayML、Pikaなどのサードパーティー製AIモデルも利用できるのがポイントです。
·gigazine.net·
Adobe Premiere Proに生成AIで「映像内のオブジェクト追加・削除」「フレームの追加」「映像素材の生成」を実行する機能が2024年中に搭載される予定
古い写真・低画質アニメ画像・イラストなどを簡単に高画質化できる「Winxvideo AI」でいろんな画像をハッキリクッキリアップグレードさせてみたレビュー
古い写真・低画質アニメ画像・イラストなどを簡単に高画質化できる「Winxvideo AI」でいろんな画像をハッキリクッキリアップグレードさせてみたレビュー
最先端のAI技術を利用して自動で動画を高画質化・フレーム補間・手ぶれ補正することができるソフトウェア「Winxvideo AI」は、動画だけでなく画像の高画質化も可能です。低画質な画像を鮮明に補正することができるということで、Winxvideo AIを使っていろんな画像を高画質化しまくってみました。
·gigazine.net·
古い写真・低画質アニメ画像・イラストなどを簡単に高画質化できる「Winxvideo AI」でいろんな画像をハッキリクッキリアップグレードさせてみたレビュー
InstagramとFacebookで有名人が画像を改変されたAIディープフェイクポルノ事件をMetaの監督委員会が調査へ
InstagramとFacebookで有名人が画像を改変されたAIディープフェイクポルノ事件をMetaの監督委員会が調査へ
2024年4月16日、Metaのプラットフォーム上で削除されるコンテンツについて監視を行う第三者組織の監督委員会がFacebookとInstagramで起こったディープフェイクポルノに関する事例2件について調査を開始したことを明らかにし、「Metaのポリシーと施行慣行がディープフェイクポルノに対処するのに効果的かどうかを評価する」と発表しました。
·gigazine.net·
InstagramとFacebookで有名人が画像を改変されたAIディープフェイクポルノ事件をMetaの監督委員会が調査へ
Amazonがレジなし決済システム「Just Walk Out」の採用店舗を2024年中に倍増させる方針を発表
Amazonがレジなし決済システム「Just Walk Out」の採用店舗を2024年中に倍増させる方針を発表
Amazonはレジ不要の実店舗システム「Just Walk Out」を開発しており、Just Walk OutはAmazonの自社店舗以外に数多くのサードパーティー事業者の店舗で採用されています。新たに、AmazonがJust Walk Out の導入店舗を2024年中に倍増させる方針を発表しました。
·gigazine.net·
Amazonがレジなし決済システム「Just Walk Out」の採用店舗を2024年中に倍増させる方針を発表
大田区、NECに賠償金480万円を請求 10月のシステム障害巡り SSD3台の同時故障想定できず
大田区、NECに賠償金480万円を請求 10月のシステム障害巡り SSD3台の同時故障想定できず
大田区は、2023年10月に発生したシステム障害の検証結果を発表した。システムの運用・保守を担っていたNECからの情報共有が不十分だったことなどが原因にあるとし、同社に対して損害賠償金486万8437円を請求した。
·itmedia.co.jp·
大田区、NECに賠償金480万円を請求 10月のシステム障害巡り SSD3台の同時故障想定できず
イーロン・マスクのAI企業が画像を理解可能なマルチモーダルAI「Grok-1.5」を発表、「GPT-4V」や「Gemini Pro 1.5」に匹敵する性能
イーロン・マスクのAI企業が画像を理解可能なマルチモーダルAI「Grok-1.5」を発表、「GPT-4V」や「Gemini Pro 1.5」に匹敵する性能
イーロン・マスク氏が設立したAI企業「xAI」が、同社初のマルチモーダルAIモデル「Grok-1.5」を発表しました。Grok-1.5は画像の理解が可能で、「フローチャートを認識してコードを書く」「栄養成分表示を見てカロリーを計算する」といった操作が可能です。
·gigazine.net·
イーロン・マスクのAI企業が画像を理解可能なマルチモーダルAI「Grok-1.5」を発表、「GPT-4V」や「Gemini Pro 1.5」に匹敵する性能
Adobeの画像生成AI「Firefly」の学習用データセットにMidjourneyなど別の画像生成AIが生成した画像が全体の約5%ほど混入していることが判明
Adobeの画像生成AI「Firefly」の学習用データセットにMidjourneyなど別の画像生成AIが生成した画像が全体の約5%ほど混入していることが判明
Adobeの画像生成AI「Firefly」は、Adobe Stockという写真や映像のライブラリでトレーニングされていることが特徴で、インターネット上の画像をスクレイピングして学習した他の画像生成AIと異なり、商業的にも安全なAIだとAdobeは主張しています。しかし、実際はFireflyの学習したデータセットにMidjourneyなどによって生成された画像が含まれていると、アメリカ経済紙のBloombergが報じています。
·gigazine.net·
Adobeの画像生成AI「Firefly」の学習用データセットにMidjourneyなど別の画像生成AIが生成した画像が全体の約5%ほど混入していることが判明
NTT、大規模言語モデルを使った視覚読解技術を実現、図表などを含む「文書」を読めるAIに
NTT、大規模言語モデルを使った視覚読解技術を実現、図表などを含む「文書」を読めるAIに
日本電信電話株式会社(NTT)は4月12日、大規模言語モデル(LLM)により、図表やグラフ、文字修飾やレイアウトといった情報を含む文書を読解する、視覚読解技術を実現したと発表した。同社製のLLM「tsuzumi」のアダプタ技術として採用・導入されている。
·internet.watch.impress.co.jp·
NTT、大規模言語モデルを使った視覚読解技術を実現、図表などを含む「文書」を読めるAIに
“機械学習パラダイス”…AI学習し放題に歯止め、文化庁など業界に指針 ニュースイッチ by 日刊工業新聞社
“機械学習パラダイス”…AI学習し放題に歯止め、文化庁など業界に指針 ニュースイッチ by 日刊工業新聞社
人工知能(AI)技術と著作権など、生成AIに対して社会が抱える懸念に対処する方向性が見えてきた。文化庁の小委員会は著作権の考え方を、内閣府の知的財産戦略推進事務局は知財全般の骨子案をそれぞれ示した。流...
·newswitch.jp·
“機械学習パラダイス”…AI学習し放題に歯止め、文化庁など業界に指針 ニュースイッチ by 日刊工業新聞社
FFmpeg 7.0が公開される、「ネイティブVVCデコーダーの追加」「CLIツールのマルチスレッド化」「非推奨APIの削除」など
FFmpeg 7.0が公開される、「ネイティブVVCデコーダーの追加」「CLIツールのマルチスレッド化」「非推奨APIの削除」など
マルチメディアフレームワーク「FFmpeg」のバージョン7.0(コードネーム:Dijkstra)が2024年4月5日に公開されました。FFmpeg 7.0では「ネイティブVVCデコーダーの追加」「IAMFのサポート」「CLIツールのマルチスレッド化」「非推奨APIの削除」といった変更が加わっています。
·gigazine.net·
FFmpeg 7.0が公開される、「ネイティブVVCデコーダーの追加」「CLIツールのマルチスレッド化」「非推奨APIの削除」など
100万時間以上のYouTube動画をOpenAIがAIモデルのトレーニングに利用していたことが判明
100万時間以上のYouTube動画をOpenAIがAIモデルのトレーニングに利用していたことが判明
OpenAIが、AIモデルのトレーニングに用いるために100万時間を超える分量のYouTube動画をダウンロードして利用していたことがThe NewYork Timesの指摘でわかりました。なお、YouTubeと同じ親会社AlphabetのもとにいるGoogleは、OpenAIの行為に気付いていましたが、自分たちも独自のAIモデルのトレーニングにYouTubeの動画を活用していたため、行動を起こさなかったとのことです。
·gigazine.net·
100万時間以上のYouTube動画をOpenAIがAIモデルのトレーニングに利用していたことが判明
インターネットアーカイブがカリブ海の島「アルバ」と協力して10万点超の歴史的資料をデジタルアーカイブとして公開
インターネットアーカイブがカリブ海の島「アルバ」と協力して10万点超の歴史的資料をデジタルアーカイブとして公開
さまざまなウェブページやデジタルコンテンツの保存活動を行う非営利団体のインターネットアーカイブが、カリブ海に浮かぶオランダ領アルバの公的機関と協力し、アルバにまつわる10万点超の歴史的資料をデジタル化して公開しました。「Coleccion Aruba」と名付けられたこのデジタルアーカイブは、インターネットアーカイブのウェブサイトを通じて世界中のどこからでも閲覧可能です。
·gigazine.net·
インターネットアーカイブがカリブ海の島「アルバ」と協力して10万点超の歴史的資料をデジタルアーカイブとして公開
Appleがスマホの画面を認識できるマルチモーダルLLM「Ferret-UI」を発表、SiriがiPhoneアプリのUIを理解できるようになる可能性も
Appleがスマホの画面を認識できるマルチモーダルLLM「Ferret-UI」を発表、SiriがiPhoneアプリのUIを理解できるようになる可能性も
Appleの研究者が、スマートフォンのアプリUIを理解するために設計したマルチモーダル大規模言語モデル(MLLM)の「Ferret-UI」を開発したという論文を、未査読論文リポジトリであるarXivで公開しました。
·gigazine.net·
Appleがスマホの画面を認識できるマルチモーダルLLM「Ferret-UI」を発表、SiriがiPhoneアプリのUIを理解できるようになる可能性も
Googleが放射線科医向けに画像診断・病歴チェック・論文検索が可能なAIシステムをバイエルと提携して構築
Googleが放射線科医向けに画像診断・病歴チェック・論文検索が可能なAIシステムをバイエルと提携して構築
Google Cloudが医薬品メーカーのバイエルと提携し、放射線科医向けのAI搭載ヘルスケアアプリケーションを開発することが明らかになりました。主に医療データの約90%を占めるとされる画像データの分析が行われる予定で、患者の画像を以前の画像と比較したり、画像内の異常にフラグを立てて関連する医療情報を提示したりすることが可能になります。
·gigazine.net·
Googleが放射線科医向けに画像診断・病歴チェック・論文検索が可能なAIシステムをバイエルと提携して構築
生成AIの学習に用いた資料の公開を義務付ける「生成AI著作権開示法」案が提出される
生成AIの学習に用いた資料の公開を義務付ける「生成AI著作権開示法」案が提出される
アメリカ・民主党のアダム・シフ下院議員がAI企業に対し、生成AIモデルの開発に使用した著作権のある素材を開示することを義務付ける「生成AI著作権開示法(Generative AI Copyright Disclosure Act)」案を提出しました。この法案は、AI企業が著作権のあるコンテンツを不正に使用してツールを開発しているのではないかという懸念から生まれたものです。
·gigazine.net·
生成AIの学習に用いた資料の公開を義務付ける「生成AI著作権開示法」案が提出される
Googleが「消しゴムマジック」などのAI画像編集ツールをiPhoneも含めた全Googleフォトユーザーに無料開放
Googleが「消しゴムマジック」などのAI画像編集ツールをiPhoneも含めた全Googleフォトユーザーに無料開放
Googleフォトに搭載されている、写真内の不要なものを削除する「消しゴムマジック」や撮影時のボケや手ぶれを取り除く「ボケ補正」などのAIを利用した編集ツールが、Google Pixelユーザーおよびサブスクリプションサービス「Google One」の加入者だけでなく、Googleフォトユーザー全体に無料で開放されることがわかりました。
·gigazine.net·
Googleが「消しゴムマジック」などのAI画像編集ツールをiPhoneも含めた全Googleフォトユーザーに無料開放
Instagramが10代の若者のDMでヌード画像を自動検出してぼかして送信者と受信者に警告画面を表示する機能をテスト予定
Instagramが10代の若者のDMでヌード画像を自動検出してぼかして送信者と受信者に警告画面を表示する機能をテスト予定
Metaが、未成年がSNSで性的脅迫を受ける「セクストーション」被害への対策として、ダイレクトメッセージ(DM)で送られるヌード画像を検出してぼかしを加え、さらに警告画面を表示する機能をInstagramに搭載するテストを行うと発表しました。
·gigazine.net·
Instagramが10代の若者のDMでヌード画像を自動検出してぼかして送信者と受信者に警告画面を表示する機能をテスト予定
2026年までにAIのトレーニングに使うデータが枯渇する「データ不足問題」とは?
2026年までにAIのトレーニングに使うデータが枯渇する「データ不足問題」とは?
インターネット上には膨大なデータが存在しており、それらを学習させることで作られたAIが続々と登場するようになりました。AIの普及が爆発的に進む一方、研究者からはAIシステムを動かす燃料である学習データが枯渇する可能性があると懸念する声が上がっています。
·gigazine.net·
2026年までにAIのトレーニングに使うデータが枯渇する「データ不足問題」とは?
Adobeが動画生成AIのトレーニング用コンテンツ収集のため「動画1分に最大1000円超」の報酬を用意
Adobeが動画生成AIのトレーニング用コンテンツ収集のため「動画1分に最大1000円超」の報酬を用意
ジェネレーティブAI「Adobe Firefly」に画像生成だけではなく動画生成を行わせるため、Adobeがトレーニング用のコンテンツ収集に動き出したことをBloombergが報じました。動画提供に対する報酬は、1分につき最高7.25ドル(約1110円)ほどになる可能性があるとのことです。
·gigazine.net·
Adobeが動画生成AIのトレーニング用コンテンツ収集のため「動画1分に最大1000円超」の報酬を用意
Metaがテキストベースのプロンプトに視覚情報ベースで回答するAIエージェントのベンチマーク「OpenEQA」をリリース
Metaがテキストベースのプロンプトに視覚情報ベースで回答するAIエージェントのベンチマーク「OpenEQA」をリリース
現地時間の2024年4月11日、Metaがテキストベースの質問に対してAIエージェントの物理空間の理解度を測定することができるベンチマーク「OpenEQA」をリリースしました。
·gigazine.net·
Metaがテキストベースのプロンプトに視覚情報ベースで回答するAIエージェントのベンチマーク「OpenEQA」をリリース
生成AIアプリで男子学生が女子の「ディープヌード」を作成する問題が深刻化している
生成AIアプリで男子学生が女子の「ディープヌード」を作成する問題が深刻化している
2023年に、アメリカ・ニュージャージー州ウェストフィールド高等学校の男子生徒らが、AIを使用して作成した女子生徒のヌード画像を共有する事件が発生しました。この事件の続報と、他の地域でも次々と発生している類似の問題を、The New York Timesがまとめています。
·gigazine.net·
生成AIアプリで男子学生が女子の「ディープヌード」を作成する問題が深刻化している
「AI脚本」を人気声優が朗読…銘打ったイベントは中止、「盗作」と批判相次ぎ
「AI脚本」を人気声優が朗読…銘打ったイベントは中止、「盗作」と批判相次ぎ
【読売新聞】「AI脚本」を、人気声優が朗読する――。そう銘打ったイベントが3月、中止に追い込まれる事態が起きた。生成AI(人工知能)が脚本などの著作物を無断学習している可能性を踏まえ、「盗作脚本ではないか」「声優を応援できない」など
·yomiuri.co.jp·
「AI脚本」を人気声優が朗読…銘打ったイベントは中止、「盗作」と批判相次ぎ
Appleが空中に人の顔が浮かぶApple Vision Proの「空間ペルソナ」のパブリックベータ版をリリース
Appleが空中に人の顔が浮かぶApple Vision Proの「空間ペルソナ」のパブリックベータ版をリリース
Appleは2024年4月2日に、visionOS 1.1がインストールされたApple Vision Pro向けに「空間ペルソナ」を導入しました。この空間ペルソナを実際に試した複数のメディアが、その使用感をレビューしています。
·gigazine.net·
Appleが空中に人の顔が浮かぶApple Vision Proの「空間ペルソナ」のパブリックベータ版をリリース