画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2790 bookmarks
Custom sorting
画像生成AI「Stable Diffusion」をGoogle Colaboratoryで動かして画像の保存先をGoogleドライブにする方法
画像生成AI「Stable Diffusion」をGoogle Colaboratoryで動かして画像の保存先をGoogleドライブにする方法
2022年8月23日に一般向けで公開された画像生成AI「Stable Diffusion」は、入力した文字列に沿ってまるで人が描いた絵や写真のような画像を生成してくれます。実際に使うとなるとNVIDIA製GPUを搭載したマシンが必要で、導入にもある程度の知識が求められますが、Googleが提供しているPython実行環境「Google Colaboratory」を使えば、低スペックのノートPCでも無料でStable Diffusionで動かすことが可能。しかし、無料版では一定時間でランタイムの切断が行われるのですが、Google Colaboratory上で生成された画像はあくまで一時的なものなので、ローカルに保存していなければ生成した画像が消えてしまいます。そこで、Google ColaboratoryにGoogleドライブをマウントし、画像の出力先をGoogleドライブのフォルダに指定することで、画像を自動でGoogleドライブに保存するようにしてみました。
·gigazine.net·
画像生成AI「Stable Diffusion」をGoogle Colaboratoryで動かして画像の保存先をGoogleドライブにする方法
画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ
画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ
2022年8月23日に無料公開された画像生成AI「Stable Diffusion」は、「ボールで遊ぶ猫」「森の中を走る犬」といった指示を与えると指示通りの画像を出力してくれます。Stable Diffusionはデモページで画像生成を試せる他、NVIDIA製GPUを搭載したマシンを用いてローカル環境で実行することも可能です。しかし、デモページは待ち時間が長く、NVIDIA製GPUは所持していない人も多いはず。Googleが提供しているPython実行環境「Colaboratory」を利用すれば、NVIDIA製GPUを所持していなくともStable Diffusionを待ち時間なしで実行する環境を無料で整えられるので、実際に環境を構築する手順や画像を生成する手順を詳しくまとめてみました。
·gigazine.net·
画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ
文字列から画像を生成するAI「DALL・E 2」でイメージ通りの画像を生成するまで試行錯誤してみた記録
文字列から画像を生成するAI「DALL・E 2」でイメージ通りの画像を生成するまで試行錯誤してみた記録
OpenAI開発の入力したテキストから画像を生成するAI「DALL・E 2」は2022年4月に研究者・専門家向けに公開され、2022年7月に一般向けに公開されました。AIプログラミングコンテスト・Coder Oneの共同創設者であるジョイ・チャン氏が、自身が出力したい画像をDALL・E2に生成してもらうまでの試行錯誤をブログで公開しています。
·gigazine.net·
文字列から画像を生成するAI「DALL・E 2」でイメージ通りの画像を生成するまで試行錯誤してみた記録
ヌード画像をカスタムAIアルゴリズムで自動生成する「pornpen.ai」
ヌード画像をカスタムAIアルゴリズムで自動生成する「pornpen.ai」
2022年8月23日に無料公開された画像生成AI「Stable Diffusion」は、エロい画像の生成はブロックされることがわかっています。それでもどうしてもエロ画像を生成したいという時に役立つかもしれないのが、カスタムAIアルゴリズムでヌード画像を生み出す「pornpen.ai」です。
·gigazine.net·
ヌード画像をカスタムAIアルゴリズムで自動生成する「pornpen.ai」
キーワードに沿ってまるで人間が描いたような絵や写真を生み出すAI「Stable Diffusion」が一般公開されたので使ってみた
キーワードに沿ってまるで人間が描いたような絵や写真を生み出すAI「Stable Diffusion」が一般公開されたので使ってみた
ロンドンとカリフォルニアを拠点とするスタートアップ・Stability AIが、まるで人間のアーティストが描いたような高クオリティの画像を生み出せる画像生成AI「Stable Diffusion」を一般公開しました。モデルはCreative ML OpenRAIL-Mライセンスの下でリリースされており、商用での利用も許可されています。
·gigazine.net·
キーワードに沿ってまるで人間が描いたような絵や写真を生み出すAI「Stable Diffusion」が一般公開されたので使ってみた
まるで人間のアーティストが描いたような画像を生成するAIが「アーティストの権利を侵害している」と批判される
まるで人間のアーティストが描いたような画像を生成するAIが「アーティストの権利を侵害している」と批判される
イギリスのロンドンとアメリカのロスアルトスを拠点とするスタートアップ・Stability AIが2022年8月10日、まるで人間のアーティストが描いたような高クオリティの画像を生み出せる画像生成AI「Stable Diffusion」を研究者向けにリリースしました。Stable Diffusionは間もなく一般公開も予定されていますが、人間のアーティストからは「アーティストの権利を侵害している」といった批判が寄せられています。
·gigazine.net·
まるで人間のアーティストが描いたような画像を生成するAIが「アーティストの権利を侵害している」と批判される
IKEAが自分の部屋を3Dスキャンして「家具をIKEA製品と置き換えてデザインをチェックできるアプリ」を発表
IKEAが自分の部屋を3Dスキャンして「家具をIKEA製品と置き換えてデザインをチェックできるアプリ」を発表
スウェーデンの大手家具メーカーであるIKEAが、自分の部屋を正確に3Dスキャンして既存の家具をIKEAの家具に置き換えてデザインをチェックできるアプリ「IKEA Kreativ」を発表しました。IKEAはAIを用いて開発した新たなアプリが人々にインスピレーションを与え、創造性を解き放ち、家具がフィットするのかどうかを視覚化できると主張しています。
·gigazine.net·
IKEAが自分の部屋を3Dスキャンして「家具をIKEA製品と置き換えてデザインをチェックできるアプリ」を発表
テキストの説明と超ざっくりしたイラストから高クオリティな画像を生成可能な「Make-A-Scene」をMetaが発表
テキストの説明と超ざっくりしたイラストから高クオリティな画像を生成可能な「Make-A-Scene」をMetaが発表
近年では、適当な落書きから風景画像を生成するNVIDIAの「NVIDIA Canvas」や文章から画像を生成できるOpen AIの「DALL・E 2」など、AIを用いたペイントツールがいくつか登場しています。新たにFacebookを運営するMetaが、テキストによる説明とざっくりしたイラストを組み合わせ、より精度の高い画像を生成できるAIペイントツール「Make-A-Scene」を発表しました。
·gigazine.net·
テキストの説明と超ざっくりしたイラストから高クオリティな画像を生成可能な「Make-A-Scene」をMetaが発表
OpenAIがAI画像ジェネレーター「DALL・E2」の一般向け公開がスタート
OpenAIがAI画像ジェネレーター「DALL・E2」の一般向け公開がスタート
2022年4月に研究者・専門家向けに提供が始まった画像生成・編集AI「DALL・E2」の一般向けベータ版が公開されました。順番待ちリストに入っているユーザーが順次利用できるようになり、今後数週間で100万人に提供される見込みです。
·gigazine.net·
OpenAIがAI画像ジェネレーター「DALL・E2」の一般向け公開がスタート
ディープフェイクの弱点を突いて偽物によるビデオ通話を見破る方法とは?
ディープフェイクの弱点を突いて偽物によるビデオ通話を見破る方法とは?
人工知能(AI)や機械学習などの技術を用いて精巧な偽のコンテンツを生成することができるディープフェイクは、「この世に存在しない架空の人物の写真」を作ることができたり、誰でも映画の予告編に登場できるサービスがあったりと、愉快な使い道がある一方で、求人募集の画像やビデオ通話での映像にディープフェイクを用いる詐欺が行われているとアメリカの連邦捜査局(FBI)が警告するケースも起きています。そんな中、「ビデオ通話の相手がディープフェイクを用いているかどうかを見分ける方法」について、テクノロジー系メディアのMetaphysic.aiがディープフェイクの弱点を指摘しながら解説しています。
·gigazine.net·
ディープフェイクの弱点を突いて偽物によるビデオ通話を見破る方法とは?
ロシアの「プロパガンダ」から「営業活動」まで…一般人には見破ることができない「ディープフェイク」のヤバさ(小林 啓倫) @moneygendai
ロシアの「プロパガンダ」から「営業活動」まで…一般人には見破ることができない「ディープフェイク」のヤバさ(小林 啓倫) @moneygendai
ディープフェイクはやっかいだが、これは戦争という異常事態の中での話で、私たちの日常生活とは関係ない――それは間違いだ。実は個人を対象とした、「ディープフェイク詐欺」とも呼べるような活動が行われていることが明らかになっているのだ。
·gendai.media·
ロシアの「プロパガンダ」から「営業活動」まで…一般人には見破ることができない「ディープフェイク」のヤバさ(小林 啓倫) @moneygendai
無料&登録不要で写真に写った不要な部分をサクッと消してくれる「cleanupphotos」
無料&登録不要で写真に写った不要な部分をサクッと消してくれる「cleanupphotos」
写真に写ってしまった人影やゴミ、建物などをサクッと消してしまえるサービスが「cleanupphotos」です。Google Pixel 6やAdobe Photoshopなどにも同様の機能がありますが、cleanupphotosはサイトにアクセスするだけで無料で手軽に使えます。
·gigazine.net·
無料&登録不要で写真に写った不要な部分をサクッと消してくれる「cleanupphotos」
「飲み物に何か混入されていないか」をスマホカメラで検出 気泡の形や動きから予測
「飲み物に何か混入されていないか」をスマホカメラで検出 気泡の形や動きから予測
シンガポール国立大学と韓国Yonsei Universityの研究チームは、スマートフォンのカメラのみで開封前の密封されたボトル内の液体内容物に不純物が混入されていないかを検出するシステムを開発した。
·itmedia.co.jp·
「飲み物に何か混入されていないか」をスマホカメラで検出 気泡の形や動きから予測
カメラで顔を写すだけで魅力度や寿命を予測してくれる「How normal am I?」
カメラで顔を写すだけで魅力度や寿命を予測してくれる「How normal am I?」
近年ではビジネスや娯楽などさまざまな分野にAIを用いた顔認識システムが浸透していますが、一体どのように顔認識システムが動作しているのか実感するのは難しいものです。AIやビッグデータに関する倫理・人権の研究を行うProject SherpaのメンバーであるTijmen Schep氏は、そんな顔認識アルゴリズムの動作を誰もが体験できるように、魅力・年齢・BMI・寿命・性別などを予測する「How normal am I?」というウェブサイトを作成しました。
·gigazine.net·
カメラで顔を写すだけで魅力度や寿命を予測してくれる「How normal am I?」
複数の静止画から3Dモデルを生成する技術「NeRF」はディープフェイクを進歩させるのか?
複数の静止画から3Dモデルを生成する技術「NeRF」はディープフェイクを進歩させるのか?
ディープフェイクとはAIを利用して偽の人物画像・動画を作成する技術であり、有名人のフェイクポルノ動画や政治家のスピーチに見せかけたフェイク動画などが出回るなど、さまざまな分野で物議を醸しています。そんなディープフェイクが直面する課題や、その課題を克服する可能性を持っている「Neural Radiance Fields(ニューラル・ラディアンス・フィールド/NeRF)」といった技術について、テクノロジー系メディアのMetaphysic.aiがまとめています。
·gigazine.net·
複数の静止画から3Dモデルを生成する技術「NeRF」はディープフェイクを進歩させるのか?
建設現場の画像を地図とひも付けて自動で整理
建設現場の画像を地図とひも付けて自動で整理
スカイマティクスは、建設現場の情報管理の負荷を低減するサービスとして、従来のドローン計測機能に加え、写真や動画データの管理機能が一体となったクラウドサービス「KUMIKI(くみき)」を提供している。
·active.nikkeibp.co.jp·
建設現場の画像を地図とひも付けて自動で整理
AIでブドウを自動剪定、NECの米子会社がスタートアップ企業を設立
AIでブドウを自動剪定、NECの米子会社がスタートアップ企業を設立
新事業の創出を手掛けるNECの子会社、米NEC Xはスタートアップ企業を設立したと発表した。設立した企業はブドウの自動剪定(せんてい)などをするソリューションを提供していく。2022年4月27日、NECと共同で発表した。
·active.nikkeibp.co.jp·
AIでブドウを自動剪定、NECの米子会社がスタートアップ企業を設立
手指を使う細かい作業をAIで識別、NECが映像解析の新技術を開発
手指を使う細かい作業をAIで識別、NECが映像解析の新技術を開発
NECは2022年6月20日、手指を使う細かい作業をAI(人工知能)で識別する映像解析技術を開発したと発表した。手指の動きを捉え、数十種類の細かい作業を高精度に識別する。製造や建設、物流、小売りなどの現場で検証を進め、2022年度中の事業化を目指す。
·active.nikkeibp.co.jp·
手指を使う細かい作業をAIで識別、NECが映像解析の新技術を開発
中国政府は国民を監視するため大量の顔認識カメラを導入したりDNAデータベースを構築したりしていると入札文書から発覚
中国政府は国民を監視するため大量の顔認識カメラを導入したりDNAデータベースを構築したりしていると入札文書から発覚
中国はテクノロジーを利用して国民を監視するシステムを洗練させており、これまでには一般市民が隣人を監視できるシステムや、外国人ジャーナリストや留学生をターゲットにした監視システムなどが構築されつつあります。そんな中国の国民監視テクノロジーについて、アメリカの日刊紙であるニューヨーク・タイムズが10万件以上の政府入札文書を調査し、その実態についてまとめたレポートを公開しました。
·gigazine.net·
中国政府は国民を監視するため大量の顔認識カメラを導入したりDNAデータベースを構築したりしていると入札文書から発覚
Microsoftが「感情を読み取る」と物議を醸した顔認証ツールを廃止
Microsoftが「感情を読み取る」と物議を醸した顔認証ツールを廃止
Microsoftが、年齢や性別、表情などを読み取る顔認識サービスの一部機能を廃止することを発表しました。これらの「人々の感情を読み取る機能」は、Microsoftの社内外で正当性やプライバシーに関する物議を醸していました。
·gigazine.net·
Microsoftが「感情を読み取る」と物議を醸した顔認証ツールを廃止
無料で残像が生み出すモーションブラーを簡単に確認できる「UFO Test: Moving Photo」
無料で残像が生み出すモーションブラーを簡単に確認できる「UFO Test: Moving Photo」
ファーストパーソン・シューティングゲーム(FPS)や格闘ゲームなど、60分の1秒以下の動きが勝敗を分けるようなゲームをプレイする場合、残像や映像のブレである「モーションブラー」はなるべく避けたいもの。「UFO Test: Moving Photo」では、モーションブラーとは果たしてどういうものなのかを体験できます。
·gigazine.net·
無料で残像が生み出すモーションブラーを簡単に確認できる「UFO Test: Moving Photo」
AI画像ジェネレーター「DALL・E 2」は独自の「秘密言語」を持っているか?
AI画像ジェネレーター「DALL・E 2」は独自の「秘密言語」を持っているか?
自然言語処理と画像生成を組み合わせたAI画像ジェネレーター「DALL・E 2」で、人間からすると意味のない文字列を入力したときに似たような画像が生成されることがあるため「秘密の言語がある」と研究者が指摘しました。
·gigazine.net·
AI画像ジェネレーター「DALL・E 2」は独自の「秘密言語」を持っているか?
味の素“シンプルすぎる”レシピ 10年前に開発したメニューがいま大人気の訳
味の素“シンプルすぎる”レシピ 10年前に開発したメニューがいま大人気の訳
味の素が開発したレシピが「シンプルすぎる」と大きな話題を呼んでいる。豚ひき肉のかたまりをマヨネーズで味付けし、そのまま焼くだけ――。Webサイトにアクセスが集中し、一時パンクするほどの注目を集めたレシピは、2010年に開発したもの。なぜいま、反響を呼んでいるのか。開発した経緯などを担当者に聞いた。
·itmedia.co.jp·
味の素“シンプルすぎる”レシピ 10年前に開発したメニューがいま大人気の訳
「被写体をガラス玉に閉じ込めたような写真」を撮影できる無料カメラアプリ「Spielen」を使ってみた
「被写体をガラス玉に閉じ込めたような写真」を撮影できる無料カメラアプリ「Spielen」を使ってみた
レンズの前にガラス玉を配置して撮影された「被写体をガラス玉に閉じ込めたような写真(ガラス玉写真)」をSNSなどで目にすることがありますが、実際に似たような写真を撮影しようとすると、ガラス玉を準備するのが面倒だったり光量が足りなかったりと、思い通りにいかないものです。iOS向けの無料カメラアプリ「Spielen」を使えば、手軽にガラス玉写真を撮影できるとのことなので、実際にiPhoneにインストールして撮影しまくってみました。
·gigazine.net·
「被写体をガラス玉に閉じ込めたような写真」を撮影できる無料カメラアプリ「Spielen」を使ってみた
「乳がんや脳腫瘍を検出するAI」を公開した人物は本職ではなくアマチュアのプログラマー、高性能グラボを自腹で数十枚購入
「乳がんや脳腫瘍を検出するAI」を公開した人物は本職ではなくアマチュアのプログラマー、高性能グラボを自腹で数十枚購入
2018年、「coolwulf」と名乗るプログラマーが、アップロードされたX線画像から約90%の精度で乳がんを検出するウェブサイトを無料で公開しました。中国のオンライン開発者フォーラム「V2EX」では開発者に対してさまざまな質問が寄せられましたが、coolwulfは個人的な質問には答えないまま沈黙を続けました。そして2022年、coolwulfはAIで脳腫瘍の正確な位置を検出する「NeuralRad」というプラットフォームを公開。再び表舞台に姿を見せたcoolwulfに対し、中国のニュースサイト・今日頭条がインタビューしています。
·gigazine.net·
「乳がんや脳腫瘍を検出するAI」を公開した人物は本職ではなくアマチュアのプログラマー、高性能グラボを自腹で数十枚購入
突飛なテキストからも高精度な画像を自動生成できるAIシステム「Imagen」
突飛なテキストからも高精度な画像を自動生成できるAIシステム「Imagen」
突飛なテキストからでも自然に高解像度な画像を生成することができるAIモデルの「Imagen」が発表されました。言語モデルのサイズを大きくすることでサンプルの忠実度と画像とテキストの整合性の両方が大幅に向上するそうです。
·gigazine.net·
突飛なテキストからも高精度な画像を自動生成できるAIシステム「Imagen」
AIはレントゲン写真から人種を90%の確率で見分けられる、ただし見分け方は不明
AIはレントゲン写真から人種を90%の確率で見分けられる、ただし見分け方は不明
人間の医師にとって、肌の色などがわからないレントゲン写真から患者の人種を見分けることは困難ですが、新たに医学誌のThe Lancet Digital Healthに発表された論文で、「AIは胸部X線画像から人種を90%の精度で見分けられる」ことが示されました。研究者らはAIが人種を見分ける方法についても調べましたが、今のところAIがどうやって人種を判別しているのかは不明とのことです。
·gigazine.net·
AIはレントゲン写真から人種を90%の確率で見分けられる、ただし見分け方は不明
動画に映り込んだ不要物に画像を重ねて隠したり音声だけを削除したりする方法を無料の動画編集ツール「VideoProc Vlogger」で試してみた
動画に映り込んだ不要物に画像を重ねて隠したり音声だけを削除したりする方法を無料の動画編集ツール「VideoProc Vlogger」で試してみた
スマートフォンやデジタルカメラで面白い動画が撮れたと思って見返してみると、見ず知らずの通行人の顔が映り込んでいたり、自分の声がガッツリ入っていたりと、何となく気になる要素があって「YouTubeやSNSにアップするのはなぁ……」となってしまうケースがあります。そんな時、完全無料の動画編集ツール「VideoProc Vlogger」があれば、簡単に気になるポイントを削除したり画像を重ねて隠したりすることができ、動画のクオリティを上げることが可能です。
·gigazine.net·
動画に映り込んだ不要物に画像を重ねて隠したり音声だけを削除したりする方法を無料の動画編集ツール「VideoProc Vlogger」で試してみた