画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2306 bookmarks
Custom sorting
顔認識技術により強盗犯として一度は訴えられた女性が不当逮捕として市を提訴
顔認識技術により強盗犯として一度は訴えられた女性が不当逮捕として市を提訴
顔認識技術が万能ではないことを証明する事例はいくつも存在していて、特に、有色人種の認識では誤りが起きやすいことがわかっています。アメリカでは無実の男性が顔認識システムの誤りのせいで1週間拘束される事態が起きていますが、今度は妊娠8カ月の女性を強盗犯であると判断。訴訟は証拠不十分で取り下げとなり、女性が不当逮捕だったとして市を提訴する事態になっています。
·gigazine.net·
顔認識技術により強盗犯として一度は訴えられた女性が不当逮捕として市を提訴
Stability AIが高性能画像生成モデル「SDXL 1.0」をリリース&すぐに使えるウェブアプリも公開されたので使ってみた
Stability AIが高性能画像生成モデル「SDXL 1.0」をリリース&すぐに使えるウェブアプリも公開されたので使ってみた
画像生成AI「Stable Diffusion」の開発元であるStability AIが画像生成モデル「Stable Diffusion XL 1.0(SDXL 1.0)」を公開しました。SDXL 1.0は2023年6月に研究目的で公開された「SDXL 0.9」をさらに強化したもので、すでにモデルデータが公開されている他、SDXL 1.0をサクッと使えるウェブアプリも用意されています。加えて、AmazonのAIサービス「Amazon Bedrock」でSDXL 1.0のAPIが利用可能になることも発表されています。
·gigazine.net·
Stability AIが高性能画像生成モデル「SDXL 1.0」をリリース&すぐに使えるウェブアプリも公開されたので使ってみた
Photoshopに「被写体の途切れた部分を補完」「狭い景色を拡大」など画像の拡張が可能な「拡張生成」が追加されたので使ってみた動画
Photoshopに「被写体の途切れた部分を補完」「狭い景色を拡大」など画像の拡張が可能な「拡張生成」が追加されたので使ってみた動画
Photoshopのベータ版には、テキスト入力(プロンプト)に沿った画像を生成できる機能「生成塗りつぶし(旧称:ジェネレーティブ塗りつぶし)」が搭載されており、生成塗りつぶしを応用することで「画像の外側に『画像の続き』を生成する」という操作が可能です。新たに、「画像の続きを生成する」といった操作を一発で実行できる機能「生成拡張」が追加されたので、実際に使ってみました。
·gigazine.net·
Photoshopに「被写体の途切れた部分を補完」「狭い景色を拡大」など画像の拡張が可能な「拡張生成」が追加されたので使ってみた動画
Googleが学習していない環境でも「○○を動かして」などの複雑な指示を実行できるロボットAI「RT-2」を発表
Googleが学習していない環境でも「○○を動かして」などの複雑な指示を実行できるロボットAI「RT-2」を発表
Google DeepMindが視覚および言語を行動に変換できる学習モデル「Robotic Transformer 2(RT-2)」を2023年7月28日に発表しました。RT-2を搭載したロボットは「イチゴを正しいボウルに入れて」「机から落ちそうな物を持ち上げて」といった指示を実行できる他、学習データに含まれていない指示も高い精度で実行可能です。
·gigazine.net·
Googleが学習していない環境でも「○○を動かして」などの複雑な指示を実行できるロボットAI「RT-2」を発表
AndroidにOCR機能で画像や写真からパスワードを盗むマルウェアが発見される
AndroidにOCR機能で画像や写真からパスワードを盗むマルウェアが発見される
セキュリティ対策として長いパスワードを使うと覚えておくのが大変なため、パスワードが表示された画面を画像として保存している人もいます。このような画像から、パスワードをテキストデータに変換して認証情報を窃取するマルウェアが見つかったことが報告されました。
·gigazine.net·
AndroidにOCR機能で画像や写真からパスワードを盗むマルウェアが発見される
YouTubeが「AIで動画の内容を自動で要約する機能」を実験中と明かす
YouTubeが「AIで動画の内容を自動で要約する機能」を実験中と明かす
GoogleがAIを使ってYouTubeにアップロードされている動画の要約を自動生成する実験を行っていることが、2023年7月31日付けでサポートページで告知されました。生成される要約動画はYouTubeの視聴ページと検索ページに表示されることが想定されています。
·gigazine.net·
YouTubeが「AIで動画の内容を自動で要約する機能」を実験中と明かす
アクションカメラ「Osmo Action 4」は階段ダッシュのブレも打ち消す高度なブレ補正性能が魅力
アクションカメラ「Osmo Action 4」は階段ダッシュのブレも打ち消す高度なブレ補正性能が魅力
2023年8月2日(水)に登場したDJIのアクションカメラ「Osmo Action 4」は小型ボディに高性能なブレ補正機能が詰め込まれており、激しいアクション中でも安定した映像を最大4K・120fpsで記録可能です。そんなOsmo Action 4に触れる機会を得られたので、外観チェックに続いて画角やブレ補正性能を検証してみました。
·gigazine.net·
アクションカメラ「Osmo Action 4」は階段ダッシュのブレも打ち消す高度なブレ補正性能が魅力
GoogleがAI検索に「画像と動画」機能を追加すると発表、動画の必要な部分だけをAIが見つけてくれる超便利機能
GoogleがAI検索に「画像と動画」機能を追加すると発表、動画の必要な部分だけをAIが見つけてくれる超便利機能
Googleが2023年8月2日に、AIが生成した回答を検索結果に表示する「Search Generative Experience(SGE)」に、画像と動画に関する新機能を追加することを発表しました。
·gigazine.net·
GoogleがAI検索に「画像と動画」機能を追加すると発表、動画の必要な部分だけをAIが見つけてくれる超便利機能
フレーム間の一貫性を維持したままムービーを文字で指定したテイストに変更できる技術「TokenFlow」が登場
フレーム間の一貫性を維持したままムービーを文字で指定したテイストに変更できる技術「TokenFlow」が登場
一枚の画像を元に雰囲気を変更した画像を作成する技術は2022年時点で登場していましたが、その技術をそのままムービーに応用しようとするとフレームとフレームのつながりがいびつになったり、逆にフレーム間のつながりを重視しすぎてフレーム一枚一枚のクオリティが下がったりする問題が発生していました。「TokenFlow」はワイツマン科学研究所の研究者グループが開発した手法で、ムービーのフレーム間の一貫性やクオリティを保ちながら雰囲気だけを変更することが可能です。
·gigazine.net·
フレーム間の一貫性を維持したままムービーを文字で指定したテイストに変更できる技術「TokenFlow」が登場
ジェネレーティブAIが抱える問題を浮き彫りにする「1本のバナナ問題」とは?
ジェネレーティブAIが抱える問題を浮き彫りにする「1本のバナナ問題」とは?
Stable DiffusionやChatGPTなどのジェネレーティブAIが登場したことによって、誰でも簡単に文章や画像を作成できるようになりました。IT系ニュースサイト・Digital Scienceのダニエル・フックCEOが、画像生成AIを使用した時に遭遇した「1本のバナナ問題」から、ジェネレーティブAIが抱える問題に言及しています。
·gigazine.net·
ジェネレーティブAIが抱える問題を浮き彫りにする「1本のバナナ問題」とは?
8500人超の作家が「AIのトレーニングに人間の作品を無断使用するな」とOpenAIやMetaなどのAI開発企業に求める公開書簡に署名
8500人超の作家が「AIのトレーニングに人間の作品を無断使用するな」とOpenAIやMetaなどのAI開発企業に求める公開書簡に署名
生成AIのトレーニングに作家の著作が無断で使用されているとして、全米作家協会が「AIトレーニングに著作権で保護された素材を無断で使用するな」とOpenAIやAlphabet、MetaなどのAI開発企業へ訴える公開書簡を発表しました。この公開書簡には「ハンガー・ゲーム」シリーズで知られるスーザン・コリンズ氏、カナダを代表する作家であり2019年に「誓願」でブッカー賞を受賞したマーガレット・アトウッド氏など、8500人を超える作家が署名しています。
·gigazine.net·
8500人超の作家が「AIのトレーニングに人間の作品を無断使用するな」とOpenAIやMetaなどのAI開発企業に求める公開書簡に署名
GPT-4の顔認識性能を懸念してOpenAIが顔認識機能を制限
GPT-4の顔認識性能を懸念してOpenAIが顔認識機能を制限
GPT-4の画像認識機能に備わった特定の個人を識別するという能力がプライバシー法に違反する可能性があるという懸念から、OpenAIが顔認識機能に制限をかける措置を取っていることが明らかになりました。
·gigazine.net·
GPT-4の顔認識性能を懸念してOpenAIが顔認識機能を制限
Metaが「テキストから画像」「画像からテキスト」の両方に1つのモデルで対応できる生成AI「CM3leon」を発表
Metaが「テキストから画像」「画像からテキスト」の両方に1つのモデルで対応できる生成AI「CM3leon」を発表
FacebookやInstagramといったSNSを開発するMetaの人工知能(AI)研究所であるMeta AIが、テキストから画像を生成したり、画像からテキストを生成したりすることができる単一のAIモデル「CM3leon(カメレオン)」を発表しました。
·gigazine.net·
Metaが「テキストから画像」「画像からテキスト」の両方に1つのモデルで対応できる生成AI「CM3leon」を発表
女子高生AIりんながMicrosoftのブースで人工知能ラップ&ファッションチェックを披露
女子高生AIりんながMicrosoftのブースで人工知能ラップ&ファッションチェックを披露
Microsoftが開発した人工知能「りんな」はLINEやTwitterでサービスを展開している女子高生AIです。Microsoftのディープラーニング技術と機械学習クラウドサービス「Azure Machine Learning」を組み合わせたというAIエンジンを搭載しているりんなが、東京ゲームショウ2016に出展中のMicrosoftのブースに登場し、ファッションチェックやラップを歌うなどの新機能を披露しました。
·gigazine.net·
女子高生AIりんながMicrosoftのブースで人工知能ラップ&ファッションチェックを披露
人間のような視覚・聴覚認識力を人工知能に与えるべくIBMとMITが研究協力すると発表
人間のような視覚・聴覚認識力を人工知能に与えるべくIBMとMITが研究協力すると発表
人工知能(AI)の進化はめざましく、GoogleやFacebookなどIT企業をはじめとして世界中の大学や研究機関が競うように開発しています。そんな中、IBMとMITが「現実世界の映像・音声へのAIの理解を高めること」を目的に研究協力することを発表しました。
·gigazine.net·
人間のような視覚・聴覚認識力を人工知能に与えるべくIBMとMITが研究協力すると発表
OpenAIがShutterstockとの提携範囲を拡大し画像・映像・音楽・メタデータへのアクセス可能に
OpenAIがShutterstockとの提携範囲を拡大し画像・映像・音楽・メタデータへのアクセス可能に
チャットAI「ChatGPT」や画像生成AI「DALL・E」の開発で知られるOpenAIとフォトストックサービス・Shutterstockが、2021年から続く戦略的パートナーシップの範囲を今後6年間拡大することを発表しました。
·gigazine.net·
OpenAIがShutterstockとの提携範囲を拡大し画像・映像・音楽・メタデータへのアクセス可能に
Adobeの画像生成AI「Firefly」が日本語で使えるようになったので試してみた
Adobeの画像生成AI「Firefly」が日本語で使えるようになったので試してみた
「Stable Diffusion」や「Midjourney」など、多種多様な画像生成AIが続々と登場する中、Adobeが開発した「Firefly」は著作権的にクリアな画像を生成できるAIとして企業などから大きな注目を集めています。そんなFireflyが日本語での指示を受け付けるようになったので、実際にどんな指示でどんな画像が生成されるのか試してみました。
·gigazine.net·
Adobeの画像生成AI「Firefly」が日本語で使えるようになったので試してみた
ブラウザ上で描いたスケッチをAIが画像に変換してくれるサービス「Stable Doodle」をStability AIがリリース
ブラウザ上で描いたスケッチをAIが画像に変換してくれるサービス「Stable Doodle」をStability AIがリリース
Stable DiffusionやMidjourneyなどの画像生成AIは、テキストを入力してAIに指示を出すことで画像を生成できますが、テキストだけだと自分の好みの画像を生成することはなかなか難しいものです。AI研究開発企業のStability AIが、2023年7月14日にシンプルなラフスケッチを画像へと変換できる無料サービス「Stable Doodle」の開始を発表しました。
·gigazine.net·
ブラウザ上で描いたスケッチをAIが画像に変換してくれるサービス「Stable Doodle」をStability AIがリリース
JPEGコーデックライブラリ「Libjpeg-Turbo」の開発プロジェクトが資金不足で続行困難に
JPEGコーデックライブラリ「Libjpeg-Turbo」の開発プロジェクトが資金不足で続行困難に
JPEGコーデックライブラリ「Libjpeg-Turbo」のバージョン3.0.0が2023年7月3日にリリースされました。しかし、プロジェクトの続行は資金不足のため困難であることを開発者が報告しています。
·gigazine.net·
JPEGコーデックライブラリ「Libjpeg-Turbo」の開発プロジェクトが資金不足で続行困難に
架空の飛行機写真から学ぶフェイク画像の見分け方
架空の飛行機写真から学ぶフェイク画像の見分け方
インターネット上には本物の写真に見せかけたフェイク画像が多数存在します。航空機関連の質問サイト「Aviation Stack Exchange」に投稿された「エアバスA320の写真を見つけたけど本物かフェイクか怪しい」という質問には、フェイク画像全般に通用しそうな「見分け方のポイント」が回答として寄せられています。
·gigazine.net·
架空の飛行機写真から学ぶフェイク画像の見分け方
サーバー不要&外部とのデータのやりとり無しで画像から背景を削除できるオープンソースな軽量npmライブラリ「background-removal-js」を使ってみた
サーバー不要&外部とのデータのやりとり無しで画像から背景を削除できるオープンソースな軽量npmライブラリ「background-removal-js」を使ってみた
「background-removal-js」はブラウザ内だけで動作が完結する背景削除ライブラリです。サーバーとデータをやりとりしないため、サーバーコストが不要だったりデータが流出してしまう心配がなかったりと利点がたくさんありますが、実際のところ「ちゃんと切り抜いてくれるのか」が気になるところ。今回はデモを使ってさまざまな画像の背景を削除してみます。
·gigazine.net·
サーバー不要&外部とのデータのやりとり無しで画像から背景を削除できるオープンソースな軽量npmライブラリ「background-removal-js」を使ってみた
AIが自動生成した画像かどうか見破って判別できると自称する複数のツールをテストした結果とは?
AIが自動生成した画像かどうか見破って判別できると自称する複数のツールをテストした結果とは?
「MidJourney」や「Stable Diffusion」をはじめとする画像生成AIは、まるで実写のような超高画質の画像を生成することが可能です。しかし生成された画像は人間が撮影した画像と見分けが付かず、事実を誤認してしまう可能性があることが問題となっています。そこで、AI研究団体のOpticをはじめとするさまざまな団体が、画像が人間によって撮影されたものかAIによって生成されたものかを自動検出するツールを提供しています。これらの複数のAI検出ツールを使ったテストの結果を、海外メディアのニューヨーク・タイムズが公開しています。
·gigazine.net·
AIが自動生成した画像かどうか見破って判別できると自称する複数のツールをテストした結果とは?
”無限に視野を拡げる”魔法のような画像AIの新機能「ズームアウト」が凄すぎると話題に | オタク総研
”無限に視野を拡げる”魔法のような画像AIの新機能「ズームアウト」が凄すぎると話題に | オタク総研
Discord上で利用可能な画像生成AI「Midjourney」は先日、精度向上や新機能が備わった最新バージョン「V5.2」をリリースした。今回はそれらの新機能の中でも特に多くの人々を驚かせた「ズーム...
·0115765.com·
”無限に視野を拡げる”魔法のような画像AIの新機能「ズームアウト」が凄すぎると話題に | オタク総研
文字や図形を含む「目立つQRコード」を簡単に作れる無料ウェブアプリ「QR designer」を使ってみた
文字や図形を含む「目立つQRコード」を簡単に作れる無料ウェブアプリ「QR designer」を使ってみた
スマートフォンのカメラなどから手軽に追加情報などにアクセスできるようになるQRコードは、名刺やポスターなどさまざまなものに挿入されることがありますが、デザイナー目線では「もっと目立つQRコードにしたいな」などと感じるケースも多いはず。無料で使えるウェブアプリ「QR designer」なら簡単操作で文字や図形を含むQRコードを作れるとのことなので、実際に試してみました。
·gigazine.net·
文字や図形を含む「目立つQRコード」を簡単に作れる無料ウェブアプリ「QR designer」を使ってみた
画像や動画から背景を切り取ることが可能なAIツール「Background remover AI」を使ってみた
画像や動画から背景を切り取ることが可能なAIツール「Background remover AI」を使ってみた
画像や動画の加工を行っていると「画像や動画に映し出された被写体だけを切り抜いて、別の素材に流用したい」という状況になることもあるはず。一部無料のウェブアプリ「Background remover AI」を使えば好きな画像や動画から目的の被写体だけを切り取ることが可能とのことなので、実際に使ってみました。
·gigazine.net·
画像や動画から背景を切り取ることが可能なAIツール「Background remover AI」を使ってみた
生成AIの規制が盛り込まれたEUの「AI規制法案」にGPT-4やStable Diffusionは準拠できるのか?
生成AIの規制が盛り込まれたEUの「AI規制法案」にGPT-4やStable Diffusionは準拠できるのか?
EUの立法機関である欧州議会は2023年6月14日、「EU AI Act」と呼ばれるAI規制法案の修正案を賛成多数で可決しました。EU AI Actは差別や侵害的行為を目的としたAIの利用や、警察による公共の場でのリアルタイムの顔認識技術の使用などを禁じたもので、修正案には近年注目を集めている生成AIについての規制も盛り込まれています。そこで、テクノロジー企業が開発しているさまざまな基盤モデルがEU AI Actに準拠しているのかどうか調べた結果を、スタンフォード大学の基盤モデル研究センター(CRFM)が発表しました。
·gigazine.net·
生成AIの規制が盛り込まれたEUの「AI規制法案」にGPT-4やStable Diffusionは準拠できるのか?
MCU最新作の「シークレット・インベージョン」ではAIを使ってオープニング映像が作成されている
MCU最新作の「シークレット・インベージョン」ではAIを使ってオープニング映像が作成されている
マーベル・シネマティック・ユニバース(MCU)の最新作として2023年6月21日からDisney+で配信されているドラマシリーズが「シークレット・インベージョン」です。サミュエル・L・ジャクソン演じるニック・フューリーが主人公となる本作では、オープニング映像で使用されているビジュアルをAIが作成していることが話題を呼んでいます。
·gigazine.net·
MCU最新作の「シークレット・インベージョン」ではAIを使ってオープニング映像が作成されている
Stable Diffusionなどの画像生成AIが出力する画像に電子透かしを埋め込んで追跡可能にする技術「Tree-Ring Watermarks」が提案される
Stable Diffusionなどの画像生成AIが出力する画像に電子透かしを埋め込んで追跡可能にする技術「Tree-Ring Watermarks」が提案される
「画像に透かしを入れる」と聞くと、人間が制作したコンテンツの転載や悪用を防ぐためのものだと認識している人が多いかもしれませんが、近年はAIが生成したコンテンツに透かしを入れて帰属を示す試みも進行中です。新たに、AIが生成した画像を追跡可能にする「Tree-Ring Watermarks(年輪透かし)」という技術を、メリーランド大学の博士課程でコンピューターサイエンスを研究しているユーシン・ウェン氏らが発表しました。
·gigazine.net·
Stable Diffusionなどの画像生成AIが出力する画像に電子透かしを埋め込んで追跡可能にする技術「Tree-Ring Watermarks」が提案される
画像生成AI「Stable Diffusion」の高性能モデル「SDXL 0.9」をStability AIが発表、画像と構図のディテールが大幅に改善
画像生成AI「Stable Diffusion」の高性能モデル「SDXL 0.9」をStability AIが発表、画像と構図のディテールが大幅に改善
画像生成AI「Stable Diffusion」を開発したAI研究企業のStability AIは、2023年4月に従来の画像生成AIを大幅に強化した「Stable Diffusion XL(SDXL)」のベータ版をリリースしました。そして現地時間の6月22日、SDXLベータ版から画像と構図のディテールが大幅に改善された新モデル「SDXL 0.9」がリリースされました。
·gigazine.net·
画像生成AI「Stable Diffusion」の高性能モデル「SDXL 0.9」をStability AIが発表、画像と構図のディテールが大幅に改善