画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2306 bookmarks
Custom sorting
テキストから物理法則をシミュレートしながら動画を生成するAI「Sora」をOpenAIが発表
テキストから物理法則をシミュレートしながら動画を生成するAI「Sora」をOpenAIが発表
大規模言語モデルのGPTシリーズや画像生成AIの安全性のDALL-Eを開発するOpenAIが、テキストから最長1分間の動画を生成できるAI「Sora」を発表しました。Soraは「複数のキャラクター、特定の種類のモーション、被写体と背景の正確な詳細を含む複雑なシーン」を「物理世界にどのように存在するのかを理解」した上で動画を生成できるとのことです。
·gigazine.net·
テキストから物理法則をシミュレートしながら動画を生成するAI「Sora」をOpenAIが発表
有名科学誌の査読済み論文に画像生成AIで作られた「巨大な性器を持つ謎ラットの意味不明なイラスト」が挿入され話題に
有名科学誌の査読済み論文に画像生成AIで作られた「巨大な性器を持つ謎ラットの意味不明なイラスト」が挿入され話題に
学術誌「Frontiers in Cell and Developmental Biology」に画像生成AI「Midjourney」で生成した意味不明なイラストを含む論文が掲載されました。
·gigazine.net·
有名科学誌の査読済み論文に画像生成AIで作られた「巨大な性器を持つ謎ラットの意味不明なイラスト」が挿入され話題に
セキュリティカメラメーカーのWyzeで障害発生、1万3000人の顧客が他のユーザーのカメラをのぞき見ることが可能に
セキュリティカメラメーカーのWyzeで障害発生、1万3000人の顧客が他のユーザーのカメラをのぞき見ることが可能に
セキュリティカメラメーカーのWyze製のカメラにおいて、他のユーザーのカメラ映像を閲覧できる障害が発生していたことが、2024年2月16日に報告されています。Wyzeによると、影響を受けたユーザーの数は約1万3000人に上るとのことです。
·gigazine.net·
セキュリティカメラメーカーのWyzeで障害発生、1万3000人の顧客が他のユーザーのカメラをのぞき見ることが可能に
脳スキャン画像が男性のものか女性のものか90%以上の精度で判別するAIモデルをスタンフォード大学が開発
脳スキャン画像が男性のものか女性のものか90%以上の精度で判別するAIモデルをスタンフォード大学が開発
脳には男性と女性で違いがあるといわれていますが、具体的に構造面ではっきりとわかる違いはこれまで示されてきませんでした。スタンフォード大学の脳神経科学者ヴィノッド・メノン博士らは、脳スキャン画像を読み込んで、男性のものか女性のものかを90%以上の精度で判別するAIモデルの構築に成功したことを明らかにしました。
·gigazine.net·
脳スキャン画像が男性のものか女性のものか90%以上の精度で判別するAIモデルをスタンフォード大学が開発
Appleが言語で指示するだけで写真を編集してくれる画像編集AIモデル「MGIE」をリリース、デモも公開されたので使ってみた
Appleが言語で指示するだけで写真を編集してくれる画像編集AIモデル「MGIE」をリリース、デモも公開されたので使ってみた
Appleがカリフォルニア大学サンタバーバラ校と協力し、言葉で指示するだけで写真を編集してくれるAIモデル「MGIE」をリリースしました。
·gigazine.net·
Appleが言語で指示するだけで写真を編集してくれる画像編集AIモデル「MGIE」をリリース、デモも公開されたので使ってみた
無料で300以上のAIアバターやAI音声を使って超絶簡単に動画作成ができる「Vidnoz AI」を使ってみたレビュー
無料で300以上のAIアバターやAI音声を使って超絶簡単に動画作成ができる「Vidnoz AI」を使ってみたレビュー
実写の人間のように見えるリアルなAIアバターや動く画像を作成し、日本語を含む140カ国語以上の言語に対応したAI音声読み上げ機能で自然にしゃべらせ、400種類以上あるテンプレートを使って手軽にそれっぽい動画を作れるAI動画作成ツールが「Vidnoz AI」です。通常の動画作成で必要になるカメラやマイクなどの専門機材や、出演者やナレーターといった専門スタッフを用意しなくても簡単かつ低コストで動画作成が可能になるということで、実際にどんな動画が作成できるのか使ってみました。
·gigazine.net·
無料で300以上のAIアバターやAI音声を使って超絶簡単に動画作成ができる「Vidnoz AI」を使ってみたレビュー
ネットで拡散された「テイラー・スウィフトのディープフェイクポルノ」がMicrosoftの生成AIツール「Microsoft Designer」で生成されていたとの指摘
ネットで拡散された「テイラー・スウィフトのディープフェイクポルノ」がMicrosoftの生成AIツール「Microsoft Designer」で生成されていたとの指摘
AIを用いて作成されたテイラー・スウィフトの偽ポルノ画像がインターネット上で拡散され問題となっています。この偽ポルノ画像の生成に、Microsoftが無料で提供する「Microsoft Designer」が利用されていることが明らかになったため、同社は「有名人に似た画像」を生成できないよう同サービスに制限を追加したことが明らかになりました。
·gigazine.net·
ネットで拡散された「テイラー・スウィフトのディープフェイクポルノ」がMicrosoftの生成AIツール「Microsoft Designer」で生成されていたとの指摘
AIで検索結果まとめページを作成して情報収集を爆速化できるiPhone用ブラウザ「Arc Search」レビュー
AIで検索結果まとめページを作成して情報収集を爆速化できるiPhone用ブラウザ「Arc Search」レビュー
Chromiumベースのブラウザである「Arc」を開発するThe Browser Companyが、最高のiPhone向けブラウザを目指して開発したモバイルブラウザ「Arc Search」をリリースしました。Arc Searchは開いてすぐに検索ワードの入力が可能で、検索結果上位のページを参照して情報をまとめたページをAIで自動生成してくれるとのことで、実際にインストールして使い心地を試してみました。
·gigazine.net·
AIで検索結果まとめページを作成して情報収集を爆速化できるiPhone用ブラウザ「Arc Search」レビュー
光学式マウスを改造してウェブカメラにする方法
光学式マウスを改造してウェブカメラにする方法
光学式マウスを裏返すと、赤や青のライトが点灯しています。このライトは、マウスの動きを認識するセンサーの役割がありますが、そのセンサーを応用してマウスを改造することで、マウスで写真や映像を撮影できるウェブカメラに変身させたムービーが公開されています。
·gigazine.net·
光学式マウスを改造してウェブカメラにする方法
NASAがジェイムズ・ウェッブ宇宙望遠鏡が捉えた19の銀河の写真を一挙公開、目に見えない赤外線の観測で渦巻銀河の構造が明らかに
NASAがジェイムズ・ウェッブ宇宙望遠鏡が捉えた19の銀河の写真を一挙公開、目に見えない赤外線の観測で渦巻銀河の構造が明らかに
NASAが、ジェイムズ・ウェッブ宇宙望遠鏡に搭載された近赤外線カメラ(NIRCam)と中赤外線観測装置(MIRI)を用いて観測した19の渦巻銀河の画像を公開しました。これらの画像には、従来の可視光線での観測では捉えることができなかった星の誕生の過程や神秘的な銀河の構造などが克明に収められています。
·gigazine.net·
NASAがジェイムズ・ウェッブ宇宙望遠鏡が捉えた19の銀河の写真を一挙公開、目に見えない赤外線の観測で渦巻銀河の構造が明らかに
Googleがスマートフォンを使い0.5秒で画像生成できるアプローチ「MobileDiffusion」を発表
Googleがスマートフォンを使い0.5秒で画像生成できるアプローチ「MobileDiffusion」を発表
テキストを基に画像を生成するAIモデルはいくつかありますが、高品質な画像を生成する主要なモデルは何十億ものパラメータを処理するため、基本的には強力なスペックの端末を必要とします。2024年1月31日、Googleのエンジニアらが「MobileDiffusion」というアプローチを発表し、スマートフォンのようなモバイルデバイスでも効率的に画像を生成できる方法を紹介しました。
·gigazine.net·
Googleがスマートフォンを使い0.5秒で画像生成できるアプローチ「MobileDiffusion」を発表
AIによるディープフェイクポルノ作成に対して訴訟を提起できるようになる法案が提出される
AIによるディープフェイクポルノ作成に対して訴訟を提起できるようになる法案が提出される
AIを用いて作成された精巧な偽画像・動画はディープフェイクと呼ばれており、このポルノ版が「ディープフェイクポルノ(フェイクポルノ)」です。2024年1月末、X(旧Twitter)をはじめとするソーシャルメディアプラットフォーム上で歌手のテイラー・スウィフトのフェイクポルノが拡散され、大きな問題となっているのですが、フェイクポルノを禁止するための法案提出に向けた動きが活発になっていると報じられています。
·gigazine.net·
AIによるディープフェイクポルノ作成に対して訴訟を提起できるようになる法案が提出される
Googleが無料で簡単に使える画像生成AI「Imagen 2」を公開したので使ってみた
Googleが無料で簡単に使える画像生成AI「Imagen 2」を公開したので使ってみた
Googleが高品質な画像を簡単に生成できるAI「Imagen 2」を発表しました。Imagen 2はチャットAI「Bard」やGoogleのAIプラットフォーム「Vertex AI」などで利用可能。すでに日本からも利用可能だったので実際に使ってみました。
·gigazine.net·
Googleが無料で簡単に使える画像生成AI「Imagen 2」を公開したので使ってみた
画像生成AI・Stable Diffusionのエンコーダーに見つかった致命的な欠陥とは?
画像生成AI・Stable Diffusionのエンコーダーに見つかった致命的な欠陥とは?
画像生成AIのStable Diffusionは「潜在拡散モデル」と呼ばれるAIで、テキストを入力するだけで高精度な画像を生成することが可能です。このStable Diffusionに使われている「VAE」に致命的な欠陥があるという報告が、オンライン掲示板サイトのRedditに投稿されています。
·gigazine.net·
画像生成AI・Stable Diffusionのエンコーダーに見つかった致命的な欠陥とは?
私たちの目がどのように見たものを捉えて処理しているのかを視覚化したムービー
私たちの目がどのように見たものを捉えて処理しているのかを視覚化したムービー
私たちの目は、水晶体で集めた光の焦点を光彩で合わせ、網膜に像を投影して捉えたものを見ています。ただし、目に映った像をそのまま見ているわけではなく、見たものを脳で画像処理して認識しています。DIY等のムービーを投稿するカナダの家具デザイナーであるマティアス・ヴァンデル氏が、目で見たものを処理するプロセスや目の能力が持つ特色について視覚化したデモンストレーションを、自身のYouTubeチャンネルで解説しています。
·gigazine.net·
私たちの目がどのように見たものを捉えて処理しているのかを視覚化したムービー
画像生成AI・Midjourneyの各バージョンでさまざまなスタイルを出力した画像を集めた「Midlibrary」
画像生成AI・Midjourneyの各バージョンでさまざまなスタイルを出力した画像を集めた「Midlibrary」
画像生成AI「Midjourney」は、チャットツールのDiscordにテキストを入力することで、さまざまなスタイルの写真やイラストを生成してくれます。ビジュアルアーティストのアンドレイ・コバレフ氏をはじめとするMidjourneyユーザーの有志が運営する「Midlibrary」は、Midjourneyの各バージョンで生成したさまざまなスタイルの画像を保存・公開するサイトで、バージョンによる生成結果の違いを見比べることができるので、Midjourneyで画像を生成したい場合の参考になります。
·gigazine.net·
画像生成AI・Midjourneyの各バージョンでさまざまなスタイルを出力した画像を集めた「Midlibrary」
画像に「毒」を盛ることでAIによる画像学習を防止するツール「Nightshade」が一般公開され誰でも使用可能に
画像に「毒」を盛ることでAIによる画像学習を防止するツール「Nightshade」が一般公開され誰でも使用可能に
2024年1月19日、シカゴ大学の研究チームが開発した、AIによる画像の学習を防止するツール「Nightshade」が一般公開され、誰でもダウンロード可能になりました。
·gigazine.net·
画像に「毒」を盛ることでAIによる画像学習を防止するツール「Nightshade」が一般公開され誰でも使用可能に
VRAM容量12GBの「GeForce RTX 4070 SUPER」は画像生成AIでどれだけの性能を発揮するのか?旧世代グラボと徹底比較してみたよレビュー
VRAM容量12GBの「GeForce RTX 4070 SUPER」は画像生成AIでどれだけの性能を発揮するのか?旧世代グラボと徹底比較してみたよレビュー
2024年1月17日に発売した「GeForce RTX 4070 SUPER」はVRAMを12GB搭載しており、画像生成AIなどの生成系AIも快適に動作させられます。GeForce RTX 4070 SUPERのリファレンス実装である「GeForce RTX 4070 SUPER Founders Edition」を借りられたので、実際に画像生成AIを動作させて編集部にある「GeForce RTX 3060」や「GeForce RTX 3090」と処理性能を比較してみました。
·gigazine.net·
VRAM容量12GBの「GeForce RTX 4070 SUPER」は画像生成AIでどれだけの性能を発揮するのか?旧世代グラボと徹底比較してみたよレビュー
NVIDIAがSDRの映像をHDRに変換するAI技術「RTX Video HDR」を全RTXシリーズ向けにリリース
NVIDIAがSDRの映像をHDRに変換するAI技術「RTX Video HDR」を全RTXシリーズ向けにリリース
NVIDIAが、GeForce RTX 4070 Ti SUPERが発売された2024年1月24日に、SDR(標準ダイナミックレンジ)の映像をHDR(ハイダイナミックレンジ)映像に変換する機能「RTX Video HDR」がGeForce RTXシリーズで使えるようになるドライバーアップデートをリリースしました
·gigazine.net·
NVIDIAがSDRの映像をHDRに変換するAI技術「RTX Video HDR」を全RTXシリーズ向けにリリース
Googleが超高品質な動画生成AI「Lumiere」を発表、フレーム同士のつながりが自然で「テキストや画像から動画生成」「写真の一部を動画化」「動画の一部分を指定して加工」などなど機能てんこもり
Googleが超高品質な動画生成AI「Lumiere」を発表、フレーム同士のつながりが自然で「テキストや画像から動画生成」「写真の一部を動画化」「動画の一部分を指定して加工」などなど機能てんこもり
Googleの研究チームが動画生成AI「Lumiere」を2024年1月24日(水)に発表しました。Lumiereではフレーム同士が自然につながった違和感の少ない動画を生成可能で、テキストや画像を入力して動画を生成できるほか、動画の一部分を指定して別の動画に置き換えたり、写真の一部分だけを動かしたりといった操作も可能です。
·gigazine.net·
Googleが超高品質な動画生成AI「Lumiere」を発表、フレーム同士のつながりが自然で「テキストや画像から動画生成」「写真の一部を動画化」「動画の一部分を指定して加工」などなど機能てんこもり
画像生成AI「Stable Diffusion」と「Midjourney」に対する集団訴訟でイギリスの写真家が団結呼びかけ
画像生成AI「Stable Diffusion」と「Midjourney」に対する集団訴訟でイギリスの写真家が団結呼びかけ
画像生成AIのトレーニングに作品を無断利用されたことについて、著作権侵害やデジタルミレニアム著作権法(DMCA)違反であるとして、アメリカの画家らが画像生成AI「Stable Diffusion」や「Midjourney」に対して起こした集団訴訟で、イギリスのアート界も団結しなければならないとの呼びかけが行われています。場合によっては、イギリスで独自の集団訴訟が起こされる可能性も示唆されています。
·gigazine.net·
画像生成AI「Stable Diffusion」と「Midjourney」に対する集団訴訟でイギリスの写真家が団結呼びかけ
最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた(CloseBox) | テクノエッジ TechnoEdge
最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた(CloseBox) | テクノエッジ TechnoEdge
最低1枚の写真があれば、その人物の画像をいくらでも生成できる。そんな技術が登場したので使ってみた。
·techno-edge.net·
最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた(CloseBox) | テクノエッジ TechnoEdge
画像生成AI「Midjourney」のトレーニングに作品が使用されたアーティストが心中を吐露
画像生成AI「Midjourney」のトレーニングに作品が使用されたアーティストが心中を吐露
画像生成AIのMidjourneyのトレーニングに用いられたとされる作品のアーティストをまとめたリストの存在が明らかになりました。ウェブ漫画「Cat and Girl」を発表を発表しているドロシーさんもそのリストに名前が載っていた1人で、その心中を自身のサイトで発表しています。
·gigazine.net·
画像生成AI「Midjourney」のトレーニングに作品が使用されたアーティストが心中を吐露
TikTokの親会社ByteDanceがテキストから高品質かつ忠実な動画を生成するAI「MagicVideo-V2」を発表
TikTokの親会社ByteDanceがテキストから高品質かつ忠実な動画を生成するAI「MagicVideo-V2」を発表
TikTokの親会社であるByteDanceの研究チームが、テキストに忠実かつ高品質な動画を生成するAI「MagicVideo-V2」を発表しました。人間によるパフォーマンス評価では、MagicVideo-V2がテキストから動画を生成するその他の最先端AIよりも優れているという結果が得られたとのことです。
·gigazine.net·
TikTokの親会社ByteDanceがテキストから高品質かつ忠実な動画を生成するAI「MagicVideo-V2」を発表
顔写真を入力して似た顔の画像をサクッと生成できる画像生成AIが無料公開されたので使ってみた
顔写真を入力して似た顔の画像をサクッと生成できる画像生成AIが無料公開されたので使ってみた
人物の顔写真を入力して同じ顔の画像を生成できるAIが、AIオンリーSNS「Chirper」の一機能として追加されました。記事作成時点では画像生成機能を無料で使用可能だったので、実際にどんな画像を生成できるのか確かめてみました。
·gigazine.net·
顔写真を入力して似た顔の画像をサクッと生成できる画像生成AIが無料公開されたので使ってみた
画像を分析してキャプションを自動で生成してくれるオープンソースで商用利用も可能なAIモデル「BLIP-2」をReplicate上で使ってみた
画像を分析してキャプションを自動で生成してくれるオープンソースで商用利用も可能なAIモデル「BLIP-2」をReplicate上で使ってみた
AIモデルを誰でも簡単にデプロイできるサイト「Replicate」にて、画像を分析してキャプションを生成するAIモデルのBLIP-2が簡単に利用できるとのことなので、実際にいくつかの画像を元にキャプションを生成させてみました。
·gigazine.net·
画像を分析してキャプションを自動で生成してくれるオープンソースで商用利用も可能なAIモデル「BLIP-2」をReplicate上で使ってみた
画像生成AI「Midjourney」のデイビッド・ホルツCEOとは何者なのか、2008年に「Leap Motion」を共同設立してからMidjourneyを開発するまで
画像生成AI「Midjourney」のデイビッド・ホルツCEOとは何者なのか、2008年に「Leap Motion」を共同設立してからMidjourneyを開発するまで
テキストから画像を自動生成するAIの「Midjourney」は、同名のAIスタートアップ企業によって運営されています。Midjourney社は設立して約1年半が経過しますが、これまでベンチャーキャピタリストから1円も投資を受けていないにもかかわらず、2億ドル(約290億円)の年間収益を計上しています。このMidjourney社のCEOを務めるのがデイビッド・ホルツ氏で、過去にはLeap Motionを共同設立した経歴もあります。
·gigazine.net·
画像生成AI「Midjourney」のデイビッド・ホルツCEOとは何者なのか、2008年に「Leap Motion」を共同設立してからMidjourneyを開発するまで
GPT-4を無料で使えて画像の詳細も聞けるMicrosoftのチャットAI「Microsoft Copilot」のiOS版が公開されたので使ってみた
GPT-4を無料で使えて画像の詳細も聞けるMicrosoftのチャットAI「Microsoft Copilot」のiOS版が公開されたので使ってみた
MicrosoftのチャットAI「Microsoft Copilot」のiOS向けアプリが2023年12月29日に登場しました。iOS版のMicrosoft Copilotでは文章だけでなく画像を使ったコミュニケーションも可能なほか、アカウント作成不要でGPT-4とのチャットも可能とのこと。実際にiPhoneにMicrosoft Copilotをインストールして使ってみました。
·gigazine.net·
GPT-4を無料で使えて画像の詳細も聞けるMicrosoftのチャットAI「Microsoft Copilot」のiOS版が公開されたので使ってみた
人は直感的に「AIが生成した絵画」より人間の絵を好むことが判明、AI作品は「不気味の谷現象」に陥っている可能性
人は直感的に「AIが生成した絵画」より人間の絵を好むことが判明、AI作品は「不気味の谷現象」に陥っている可能性
画像生成AIが出力した絵画を人間が描いた絵と見比べてもらう実験を行ったところ、どちらが描いた絵なのかわからなくても人間の絵の方が高く評価され、親しみやすく感じられることが確かめられました。
·gigazine.net·
人は直感的に「AIが生成した絵画」より人間の絵を好むことが判明、AI作品は「不気味の谷現象」に陥っている可能性