画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2587 bookmarks
Custom sorting
人種差別的な画像をネット中に広めるため4chanユーザーがBingの画像生成AIを悪用している実態が暴かれる
人種差別的な画像をネット中に広めるため4chanユーザーがBingの画像生成AIを悪用している実態が暴かれる
匿名掲示板「4chan」のユーザーが、Microsoftの画像生成機能「Bing イメージクリエーター」を用いて人種差別的な画像を広めるキャンペーンを行っていることが明らかになりました。
·gigazine.net·
人種差別的な画像をネット中に広めるため4chanユーザーがBingの画像生成AIを悪用している実態が暴かれる
5倍望遠カメラを搭載した「iPhone 15 Pro Max」のカメラ性能まとめ、望遠カメラでもブレ皆無で鮮明な写真を撮影可能
5倍望遠カメラを搭載した「iPhone 15 Pro Max」のカメラ性能まとめ、望遠カメラでもブレ皆無で鮮明な写真を撮影可能
2023年9月に発表された「iPhone 15 Pro Max」には、iPhone史上最長の焦点距離を備えた5倍ズームカメラが搭載されています。そんなiPhone 15 Pro Maxで実際に撮影した写真と性能評価をカメラアプリ「Halide」の開発者であるセバスティアン・デ・ウィズ氏がまとめています。
·gigazine.net·
5倍望遠カメラを搭載した「iPhone 15 Pro Max」のカメラ性能まとめ、望遠カメラでもブレ皆無で鮮明な写真を撮影可能
Adobeの画像生成AI「Firefly」のAIモデルが「Firefly Image 2 Model」など3モデルにアップデート、人間のレンダリングが向上しよりリアルな表現が可能に
Adobeの画像生成AI「Firefly」のAIモデルが「Firefly Image 2 Model」など3モデルにアップデート、人間のレンダリングが向上しよりリアルな表現が可能に
2023年10月10日、IllustratorやPhotoshopなどのクリエイティブツールで知られるAdobeが、2023年3月に発表したジェネレーティブAI「Adobe Firefly」に大幅なアップデートを加えた次世代モデル「Adobe Firefly Image 2 Model」「Adobe Firefly Vector Model」「Adobe Firefly Design Model」を発表しました。そのほかAdobeは、IllustratorやPhotoshop、Adobe Expressなどのツールにアップデートを施したことを明かしました。
·gigazine.net·
Adobeの画像生成AI「Firefly」のAIモデルが「Firefly Image 2 Model」など3モデルにアップデート、人間のレンダリングが向上しよりリアルな表現が可能に
AI生成画像検出システムがイスラエルとパレスチナの戦争の写真を「ニセモノ」と誤判定、専門家はAIで生成したものではないと指摘
AI生成画像検出システムがイスラエルとパレスチナの戦争の写真を「ニセモノ」と誤判定、専門家はAIで生成したものではないと指摘
2023年10月7日に、パレスチナのガザ地区を支配するイスラム原理主義組織のハマスがイスラエルを攻撃したことで発生した大規模紛争では、無関係な偽の写真や動画が数多くSNSに出回っていることが報告されています。これらを見分けるために活用されたAIが、本物の写真を「AIによって生成されたもの」と誤認識したことが判明しました。
·gigazine.net·
AI生成画像検出システムがイスラエルとパレスチナの戦争の写真を「ニセモノ」と誤判定、専門家はAIで生成したものではないと指摘
AIのスゴさを実感できるGoogle Pixel 8 ProとPixel 8の「ベストテイク」と「音声消しゴムマジック」を使ってみた&Pixel 7からのカメラの進化もチェック
AIのスゴさを実感できるGoogle Pixel 8 ProとPixel 8の「ベストテイク」と「音声消しゴムマジック」を使ってみた&Pixel 7からのカメラの進化もチェック
Googleの純正スマートフォン「Google Pixel 8」と「Google Pixel 8 Pro」が2023年10月12日に発売されました。Pixel 8シリーズの最大の目玉と言えるのが、前モデルからアップグレードされたチップセットのTensor G3で、実際にGIGAZINE編集部で購入してベンチマーク測定を行ったところ、その進化がはっきりと数字に表れた結果が得られています。さらに、強化されたAIの真価を実感できる新機能である「ベストテイク」と「音声消しゴムマジック」を実際に使ってみたり、Pixel 7と写真を撮り比べてカメラ性能の向上を確認してみたりしました。
·gigazine.net·
AIのスゴさを実感できるGoogle Pixel 8 ProとPixel 8の「ベストテイク」と「音声消しゴムマジック」を使ってみた&Pixel 7からのカメラの進化もチェック
Microsoft Bingの画像生成AI機能では禁止ワードの「9.11」とカービィやスポンジ・ボブなどの人気キャラクターを組み合わせた画像が簡単に作成できてしまい人間の制御できる範疇を超えてしまっているとの指摘
Microsoft Bingの画像生成AI機能では禁止ワードの「9.11」とカービィやスポンジ・ボブなどの人気キャラクターを組み合わせた画像が簡単に作成できてしまい人間の制御できる範疇を超えてしまっているとの指摘
Microsoftの検索エンジンであるBingには、画像生成AIを用いた「Bing イメージクリエーター」という機能があります。この画像生成AI機能では暴力・テロリズム・ヘイトスピーチなどに関するプロンプトが利用できないようにブロックされており、Bing イメージクリエイターの使用に関するポリシーでもこれらのコンテンツの作成は明確に禁じられています。しかし、ユーザーはBing イメージクリエーターを使って禁止されているはずのコンテンツを簡単に作成することができており、もはや人間の制御できる範疇を逸脱してしまっていると、メディアが指摘しました。
·gigazine.net·
Microsoft Bingの画像生成AI機能では禁止ワードの「9.11」とカービィやスポンジ・ボブなどの人気キャラクターを組み合わせた画像が簡単に作成できてしまい人間の制御できる範疇を超えてしまっているとの指摘
科学論文の「不正に操作された画像」を検出するAIツールはすでに人間を上回る精度だという研究結果
科学論文の「不正に操作された画像」を検出するAIツールはすでに人間を上回る精度だという研究結果
科学論文において画像やデータを不正に操作して結果を改ざんする行為は、科学全般への信頼を揺るがす深刻な問題であり、論文における不正を検出する取り組みは非常に重要です。そんな科学論文の不正に操作された画像を検出するためのAIツールは、すでに人間の目視によるチェックよりも高い精度を持っているという研究結果が、プレプリントサーバーのbioRxivに掲載された査読前論文で報告されました。
·gigazine.net·
科学論文の「不正に操作された画像」を検出するAIツールはすでに人間を上回る精度だという研究結果
画像生成AIでプロンプトのフォントサイズ・色・スタイル・脚注を反映して画像を調整する技術が登場
画像生成AIでプロンプトのフォントサイズ・色・スタイル・脚注を反映して画像を調整する技術が登場
入力された文章(プロンプト)から画像を生成するAIの機能を「Text to Image」と呼びます。このプロンプトを、プレーンテキストではなくリッチテキストにして、フォントの大きさや色、スタイル、脚注を生成する画像に反映する技術「Expressive Text-to-Image Generation」を、メリーランド大学カレッジパークの研究者らが生み出しました。
·gigazine.net·
画像生成AIでプロンプトのフォントサイズ・色・スタイル・脚注を反映して画像を調整する技術が登場
安全に商用利用可能なAI画像生成サービス「生成AI by Getty Images powered by NVIDIA」をフォトストックサービスのGetty Imagesが発表
安全に商用利用可能なAI画像生成サービス「生成AI by Getty Images powered by NVIDIA」をフォトストックサービスのGetty Imagesが発表
大手フォトストックサービスのGetty Imagesが、安全に商用利用可能なAI画像生成サービス「生成AI by Getty Images(powered by NVIDIA)」を発表しました。Getty Imagesの画像生成AIは、Getty Imagesが所有するクリエイティブ素材とデータのみでトレーニングされているため、画像生成AIの課題となっている権利的な問題をクリアしているとのことです。
·gigazine.net·
安全に商用利用可能なAI画像生成サービス「生成AI by Getty Images powered by NVIDIA」をフォトストックサービスのGetty Imagesが発表
ついにChatGPTが「見る」「聞く」「話す」に対応、人間と同じように音声で会話したり写真の内容について質問したりできる
ついにChatGPTが「見る」「聞く」「話す」に対応、人間と同じように音声で会話したり写真の内容について質問したりできる
OpenAIがChatGPTに「画像の内容を判断して応答する機能」と「テキストではなく音声でコミュニケーションする機能」を追加することを発表しました。これにより「冷蔵庫の中身を見せてレシピを提案してもらう」といった視覚を伴うコミュニケーションが可能になるほか、人間と会話するように音声コミュニケーションをとることが可能となります。
·gigazine.net·
ついにChatGPTが「見る」「聞く」「話す」に対応、人間と同じように音声で会話したり写真の内容について質問したりできる
画像生成AIで部屋の写真を読み込んでプロンプトを入力するだけで好きな家具を破綻なく描き足してくれる「Fill 3D」が登場
画像生成AIで部屋の写真を読み込んでプロンプトを入力するだけで好きな家具を破綻なく描き足してくれる「Fill 3D」が登場
画像生成AIで部屋の写真内に家具を生成する「Fill 3D」が発表されました。Fill 3Dは写真に写っている部屋の立体構造と照明を把握した上で、写真上の任意の場所にプロンプトで入力した家具をそのまま生成することができます。
·gigazine.net·
画像生成AIで部屋の写真を読み込んでプロンプトを入力するだけで好きな家具を破綻なく描き足してくれる「Fill 3D」が登場
失敗写真複数枚からベストショットを生成できるAI「RealFill」、Stable DiffusionのOutpaintingより圧倒的に正確
失敗写真複数枚からベストショットを生成できるAI「RealFill」、Stable DiffusionのOutpaintingより圧倒的に正確
写真を撮影していると「写真Aは人物の顔が見切れて、写真Bは顔が写ったけど逆光で暗すぎる」といったようにベストショットを撮影できないことがよくあります。Googleとコーネル大学の研究チームが開発したAI「RealFill」を使えば、複数の失敗写真をもとにベストショットを後から作り出せるとのことです。
·gigazine.net·
失敗写真複数枚からベストショットを生成できるAI「RealFill」、Stable DiffusionのOutpaintingより圧倒的に正確
GoogleのチャットAI「Bard」に「この動物の名前を教えて」など画像の詳細を聞けるGoogleレンズ機能が追加されたので使ってみた
GoogleのチャットAI「Bard」に「この動物の名前を教えて」など画像の詳細を聞けるGoogleレンズ機能が追加されたので使ってみた
Googleは無料で使えるチャットAI「Bard」の開発を進めています。2023年9月19日には画像の詳細を検索してくれる「Googleレンズ」がBardに統合され、画像をアップロードして画像の詳細を尋ねることが可能になりました。一体どれだけの精度で画像を解説してくれるのか気になったので、実際にBardのGoogleレンズ機能を使って性能を確かめてみました。
·gigazine.net·
GoogleのチャットAI「Bard」に「この動物の名前を教えて」など画像の詳細を聞けるGoogleレンズ機能が追加されたので使ってみた
ChatGPTに完全統合して会話から画像を生成できるAI「DALL-E 3」をOpenAIが発表、前世代よりテキストに忠実で安全性も向上
ChatGPTに完全統合して会話から画像を生成できるAI「DALL-E 3」をOpenAIが発表、前世代よりテキストに忠実で安全性も向上
AI企業のOpenAIが画像生成AIの「DALL-E 3」を2023年9月20日に発表しました。DALL-E 3は大規模言語モデル・GPTをベースにしたチャットボットAI・ChatGPTと統合されているのが特徴で、2023年10月にChatGPT PlusおよびEnterpriseの顧客に提供される予定です。
·gigazine.net·
ChatGPTに完全統合して会話から画像を生成できるAI「DALL-E 3」をOpenAIが発表、前世代よりテキストに忠実で安全性も向上
自分のイラストや写真を画像生成AIが学習するのを妨害する電子透かしを入れるツール「Mist」
自分のイラストや写真を画像生成AIが学習するのを妨害する電子透かしを入れるツール「Mist」
Stable DiffusionやMidjourneyなどの画像生成AIはデータセットの画像から学習していますが、このデータセットに含まれる画像の著作権については議論があり、「自分のイラストや写真をAIに学習されたくない」という人も多くいます。上海交通大学の研究チームが発表した「Mist」は画像に見えない透かしを入れることで、AIによって画像を認識できなくさせ、学習を防ぐ処理ツールです。
·gigazine.net·
自分のイラストや写真を画像生成AIが学習するのを妨害する電子透かしを入れるツール「Mist」
Googleが「画像生成AIで生成した画像」に電子透かしを入れてフェイクの拡散を防止するツール「SynthID」を発表
Googleが「画像生成AIで生成した画像」に電子透かしを入れてフェイクの拡散を防止するツール「SynthID」を発表
GoogleのAI研究部門「Google Deepmind」が現地時間2023年8月29日に、AIで生成された画像にウォーターマーク(電子透かし)を入れ、AIが生成した画像であることを明示してフェイク画像の拡散を防止するツール「SynthID」のベータ版をリリースしたことを発表しました。記事作成時点では、Googleの機械学習プラットフォーム「Vertex AI」上の画像生成AI「Imagen」でのみ利用可能です。
·gigazine.net·
Googleが「画像生成AIで生成した画像」に電子透かしを入れてフェイクの拡散を防止するツール「SynthID」を発表
ムービーをアニメ風にしたり被写体を変えたり映っていない部分を補完したりできるAI「MagicEdit」が登場
ムービーをアニメ風にしたり被写体を変えたり映っていない部分を補完したりできるAI「MagicEdit」が登場
AI技術は急速に進歩しており、人間が作成したものと見分けが付かない文章や画像を生成できるAIなどが複数開発されています。新たに、TikTokの運営企業であるByteDanceの研究チームが文章で指示するだけでムービーを編集できるAI「MagicEdit」を開発しました。MagicEditではムービーの一部だけを置き換える編集も可能なほか、ムービーの映っていない部分を継ぎ足すことも可能です。
·gigazine.net·
ムービーをアニメ風にしたり被写体を変えたり映っていない部分を補完したりできるAI「MagicEdit」が登場
無料でFFmpegのフィルター機能をブラウザ上でチェックできてさらにコマンドも出力してくれる「FFmpeg Explorer」
無料でFFmpegのフィルター機能をブラウザ上でチェックできてさらにコマンドも出力してくれる「FFmpeg Explorer」
動画や音声を記録・変換・再生するためのフリーソフト「FFmepg」はシェルでコマンドを入力することでさまざまな処理を実行できます。FFmpegにはさまざまなフィルタリングライブラリが存在しますが、GUIを持たないツールであるため、フィルターをかけるとどんな出力結果になるのかをプレビューすることはできません。「FFmpeg Explorer」はブラウザ上でフィルターをブラウザ上で試してどんな結果になるのかをチェックし、さらに手元で実行するためのコマンドも出力してくれるウェブツールです。
·gigazine.net·
無料でFFmpegのフィルター機能をブラウザ上でチェックできてさらにコマンドも出力してくれる「FFmpeg Explorer」
Metaが高性能映像処理モデル「DINOv2」のライセンスを更新して商用利用が可能に、同時にモデルの「公平性」を評価するためのデータセット「FACET」も公開へ
Metaが高性能映像処理モデル「DINOv2」のライセンスを更新して商用利用が可能に、同時にモデルの「公平性」を評価するためのデータセット「FACET」も公開へ
Metaが2023年8月31日に、映像処理モデル「DINOv2」のライセンスをCC BY-NC 4.0からApache License 2.0に変更すると発表しました。これまで存在していた商用利用に関する制限が取り払われ、より自由にモデルを利用することが可能になっています。同時に、モデルの公平性を評価するためのデータセット「FACET」もリリースされました。
·gigazine.net·
Metaが高性能映像処理モデル「DINOv2」のライセンスを更新して商用利用が可能に、同時にモデルの「公平性」を評価するためのデータセット「FACET」も公開へ
AIによる学習を妨害する敵対的ノイズを画像から除去できる「AdverseCleaner」を使ってみた
AIによる学習を妨害する敵対的ノイズを画像から除去できる「AdverseCleaner」を使ってみた
画像生成AIにイラストや写真を学習させることを防ぐため、「Mist」などを使って画像に敵対的サンプルと呼ばれるノイズを入れる方法があります。この敵対的サンプルによるノイズを画像から除去するためのツール「AdverseCleaner」が登場しています。
·gigazine.net·
AIによる学習を妨害する敵対的ノイズを画像から除去できる「AdverseCleaner」を使ってみた
PhotoshopやIllustratorの生成AI「Firefly」がクレジット制を導入し有料プランでも画像生成枚数が制限されるように
PhotoshopやIllustratorの生成AI「Firefly」がクレジット制を導入し有料プランでも画像生成枚数が制限されるように
画像生成AIへの注目が集まる中、PhotoshopやIllustratorなどを展開するAdobeも著作権的にクリアなことを特徴とする生成AI「Firefly」の開発を進めています。2023年9月13日(水)には、Fireflyの各種機能が一般公開されるとともにクレジット制の導入や商用利用の解禁が発表されました。
·gigazine.net·
PhotoshopやIllustratorの生成AI「Firefly」がクレジット制を導入し有料プランでも画像生成枚数が制限されるように
網膜画像から目の病気やパーキンソン病の兆候を検出するAI「RETFound」が登場、自己教師あり学習により事前トレーニングが簡潔に
網膜画像から目の病気やパーキンソン病の兆候を検出するAI「RETFound」が登場、自己教師あり学習により事前トレーニングが簡潔に
網膜の画像を用いて病気を検出するAIはすでに存在しますが、事前に大量の網膜の画像に「正常」か「正常ではない」かのラベリングを行ってトレーニングする必要がありました。新たなAI「RETFound」は、ChatGPTの仕組みなどと同様の「自己教師あり学習」を行うため、事前のトレーニングはかなり簡単になります。
·gigazine.net·
網膜画像から目の病気やパーキンソン病の兆候を検出するAI「RETFound」が登場、自己教師あり学習により事前トレーニングが簡潔に
二次元キャラに強い中国の画像生成AIで「天安門事件」「革命」など政治的な文言のブロックが行われていることが判明 - GIGAZINE
二次元キャラに強い中国の画像生成AIで「天安門事件」「革命」など政治的な文言のブロックが行われていることが判明 - GIGAZINE
中国のIT大手・Baidu(百度)が開発した画像生成AI「ERNIE-ViLG」に、多数の単語をブロックする検閲メカニズムが組み込まれていることが指摘されています。ブロック対象は習近平国家主席のような政治指導者の名前や、「天安門事件」のように中国国内でセンシティブな扱いの単語となっています。
·gigazine.net·
二次元キャラに強い中国の画像生成AIで「天安門事件」「革命」など政治的な文言のブロックが行われていることが判明 - GIGAZINE
Photoshopに画像生成AIが搭載されて「画像に好みの被写体を追加」「背景を別物に変更」といった操作を日本語で指示するだけでサクッと実行可能になったので使ってみた - GIGAZINE
Photoshopに画像生成AIが搭載されて「画像に好みの被写体を追加」「背景を別物に変更」といった操作を日本語で指示するだけでサクッと実行可能になったので使ってみた - GIGAZINE
Photoshopのベータ版には、生成AI「Firefly」を用いてテキスト入力(プロンプト)に沿った画像を生成できる機能「生成塗りつぶし(旧称:ジェネレーティブ塗りつぶし)」が搭載されています。生成塗りつぶしを使えば画像内に新たな被写体を追加したり、画像の背景を別物に置き換えたりといった操作が可能。そんな生成塗りつぶしが新たに日本語入力に対応したので使ってみました。
·gigazine.net·
Photoshopに画像生成AIが搭載されて「画像に好みの被写体を追加」「背景を別物に変更」といった操作を日本語で指示するだけでサクッと実行可能になったので使ってみた - GIGAZINE
写真1枚から、動かせる着衣3D人体モデルを高精度に生成する技術「TeCH」 DreamBoothなどで「見えない裏側領域」をリアルに復元【研究紹介】 | レバテックラボ(レバテックLAB)
写真1枚から、動かせる着衣3D人体モデルを高精度に生成する技術「TeCH」 DreamBoothなどで「見えない裏側領域」をリアルに復元【研究紹介】 | レバテックラボ(レバテックLAB)
中国やドイツの研究者らが、全身が写る写真1枚から高精度の3D着衣人体モデルを生成する手法を提案した研究報告論文を発表した。背中や後頭部などの見えない領域も一貫したテクスチャとジオメトリを持つ、忠実度の高い仕上がりで生成する。
·levtech.jp·
写真1枚から、動かせる着衣3D人体モデルを高精度に生成する技術「TeCH」 DreamBoothなどで「見えない裏側領域」をリアルに復元【研究紹介】 | レバテックラボ(レバテックLAB)
画像生成AI「Stable Diffusion」に「悪い例を集めたLoRA」を組み合わせて高品質な画像を生成する手法が登場、簡単に試せるデモも公開されたので試してみた
画像生成AI「Stable Diffusion」に「悪い例を集めたLoRA」を組み合わせて高品質な画像を生成する手法が登場、簡単に試せるデモも公開されたので試してみた
2023年7月に公開された「Stable Diffusion XL 1.0(SDXL 1.0)」は既存のStability AI製モデルと比べて高品質な画像を生成できるだけでなく、LoRAによる生成画像の調整にも対応しています。データサイエンティストのマックス・ウルフ氏は「悪い例」を集めて作成したLoRAを用いてSDXL 1.0による生成画像の品質をさらに向上させる手法を考案し、LoRAファイルおよび誰でも試せるデモを公開しています。
·gigazine.net·
画像生成AI「Stable Diffusion」に「悪い例を集めたLoRA」を組み合わせて高品質な画像を生成する手法が登場、簡単に試せるデモも公開されたので試してみた