画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2587 bookmarks
Custom sorting
MetaがAIで生成されたコンテンツを示す「Made with AI」ラベルの名称を「AI info」に変更、写真家からの苦情が原因
MetaがAIで生成されたコンテンツを示す「Made with AI」ラベルの名称を「AI info」に変更、写真家からの苦情が原因
Metaは2024年5月から、AIで作成されたコンテンツに対して「Made with AI」というラベルを付ける施策を導入しています。しかし、人間が撮影した写真にも「Made with AI」のラベルが付けられてしまうことが報告されていました。Metaは2024年7月1日に、「Made with AI」のラベル名を「AI Info」に変更したことを発表しました。
·gigazine.net·
MetaがAIで生成されたコンテンツを示す「Made with AI」ラベルの名称を「AI info」に変更、写真家からの苦情が原因
完全無料&ブラウザ上で動画編集やアニメ制作が可能なAfter Effectsっぽいウェブアプリ「PIKIMOV」
完全無料&ブラウザ上で動画編集やアニメ制作が可能なAfter Effectsっぽいウェブアプリ「PIKIMOV」
動画編集・アニメーション作成が可能なAdobeのAfter Effectsのように、デジタル合成やモーション・グラフィックス、タイトル制作などが可能なウェブアプリが「PIKIMOV」です。完全無料でブラウザから使えるとのことで、実際にPIKIMOVで動画を編集してみました。
·gigazine.net·
完全無料&ブラウザ上で動画編集やアニメ制作が可能なAfter Effectsっぽいウェブアプリ「PIKIMOV」
「顔のヒートマップ」が年齢や病気を予測する手がかりになるという研究結果
「顔のヒートマップ」が年齢や病気を予測する手がかりになるという研究結果
人間の老化や病気の兆候は身体のさまざまな場所に現れ、これらの兆候を読み取ることで病気や健康状態を診断することも可能です。新たに中国の研究チームが、「顔のヒートマップ」を調べることでその人の老化や病気を予測できるという研究結果を発表しました。
·gigazine.net·
「顔のヒートマップ」が年齢や病気を予測する手がかりになるという研究結果
3Dモデル用のメッシュを人間のアーティストが作成したように構築できる「MeshAnything」
3Dモデル用のメッシュを人間のアーティストが作成したように構築できる「MeshAnything」
2024年7月2日にMetaが発表したテキストから3Dモデルを生成できる「3D Gen」やOpenAIの「Shap-E」などの3Dモデルを簡単に生成できるAIがあったり、映像や写真から再構成された3Dモデルが配布されていたりと、さまざまな3Dモデルを簡単に手に入れることができます。一方で、手作業で作成された3Dモデルとは異なり、機械生成したものは3Dモデルを各アプリで運用するための「メッシュ」が大幅に劣ります。シンガポールの南洋理工大学や上海AIラボなどの研究者らが共同で作成した「MeshAnything」というソフトは、あらゆる3D表現に人間のアーティストが作成した3Dモデルに匹敵するメッシュを追加することができます。
·gigazine.net·
3Dモデル用のメッシュを人間のアーティストが作成したように構築できる「MeshAnything」
たった1枚の画像から高解像度の360度画像を生成する「Era3D」
たった1枚の画像から高解像度の360度画像を生成する「Era3D」
1枚の画像を認識するだけで360度の視点からの姿も立体的に生成する「Era3D」は、従来のマルチビュー手法の問題点である「不正確」「非効率」「低解像度」という問題点を解消したものになっています。Era3Dの詳細について製作者がウェブページで解説しているほか、ブラウザ上で素早く簡単にマルチビューの生成を体験することができます。
·gigazine.net·
たった1枚の画像から高解像度の360度画像を生成する「Era3D」
新型フィルムカメラ「PENTAX 17」で2024年の大阪の街並みを良い感じの雰囲気で撮影してみたよレビュー【作例62枚】
新型フィルムカメラ「PENTAX 17」で2024年の大阪の街並みを良い感じの雰囲気で撮影してみたよレビュー【作例62枚】
PENTAXブランドの新開発フィルムカメラ「PENTAX 17」が2024年7月12日(金)に登場します。PENTAX 17はハーフサイズフォーマットのフィルムカメラで、通常の2倍の枚数の写真を撮影可能。そんなPENTAX 17がGIGAZINE編集部に届いたので、令和に登場した本格フィルムカメラで一体どんな写真を撮影できるのか確かめるべく、写真を大量に撮影してきました。
·gigazine.net·
新型フィルムカメラ「PENTAX 17」で2024年の大阪の街並みを良い感じの雰囲気で撮影してみたよレビュー【作例62枚】
YouTubeの動画がどれも同じように見える現象は生物の進化と同じ仕組み
YouTubeの動画がどれも同じように見える現象は生物の進化と同じ仕組み
YouTubeのトップページを見ていると、さまざまな人が投稿しているまったく別のコンセプトを扱うムービーなのに、タイトルやサムネイルが同じようなものばかりに感じられることがあります。科学や生物学を扱うYouTubeチャンネルのMinuteEarthが、この現象を生物の収斂(しゅうれん)進化に例えて説明しています。
·gigazine.net·
YouTubeの動画がどれも同じように見える現象は生物の進化と同じ仕組み
アーティストがAIによるスタイルのコピーを防ぐための無料ツール「Glaze」がクラックされて突破されたことが明らかに
アーティストがAIによるスタイルのコピーを防ぐための無料ツール「Glaze」がクラックされて突破されたことが明らかに
シカゴ大学の研究チームが提供している、人間が描いた絵画に対し目に見えない改変を加えてAIによる学習から保護するためのツール「Glaze」について、スイスのオンラインセキュリティ研究者らのチームが「Glazeの保護は簡単に回避可能」と指摘する論文を発表しました。
·gigazine.net·
アーティストがAIによるスタイルのコピーを防ぐための無料ツール「Glaze」がクラックされて突破されたことが明らかに
信号無視を自動で取り締まる「赤信号カメラ」で事故が多発、収入の15%を反則金に依存する町も
信号無視を自動で取り締まる「赤信号カメラ」で事故が多発、収入の15%を反則金に依存する町も
信号に設置し、信号無視があった場合に自動で撮影・取り締まりを行うツールとして「赤信号カメラ」がアメリカ合衆国の一部の都市に導入されていますが、逆に事故の発生率が増加するという結果が報告されました。
·gigazine.net·
信号無視を自動で取り締まる「赤信号カメラ」で事故が多発、収入の15%を反則金に依存する町も
イラストを入力するとあたかも手描きをタイムラプス撮影しているかのような制作過程ムービーを作成できる「Paints-Undo」
イラストを入力するとあたかも手描きをタイムラプス撮影しているかのような制作過程ムービーを作成できる「Paints-Undo」
イラストを入力するだけでそのイラストの制作フローをタイムラプス撮影したかのようなムービーを出力できるAI「Paints-Undo」が開発されました。開発者はControlNetの作者として知られるllyasviel氏です。
·gigazine.net·
イラストを入力するとあたかも手描きをタイムラプス撮影しているかのような制作過程ムービーを作成できる「Paints-Undo」
作品を無断でAIトレーニングに使うことを違法化する「COPIED法」が議会へ提出される
作品を無断でAIトレーニングに使うことを違法化する「COPIED法」が議会へ提出される
アメリカ上院商務委員会の委員長であるマリア・キャントウェル上院議員ら3人の超党派議員によって、クリエイターらが自分のコンテンツがAIのトレーニングに使われたかどうかを追跡できるようにする「COPIED法」の法案を議会に提出しました。この法案が施行されれば、コンテンツの所有者が付与した来歴情報を無断で削除し、生成AIのトレーニングなどに使用することが違法となります。
·gigazine.net·
作品を無断でAIトレーニングに使うことを違法化する「COPIED法」が議会へ提出される
Google DeepMindが「動画にピッタリな音楽を生成するAI」を発表
Google DeepMindが「動画にピッタリな音楽を生成するAI」を発表
画像や文章を生成するAIに続いて、動画生成AIも急速に進歩しつつありますが、これまでのAIが生成した動画は無音か人間が音を後付けしたものばかりでした。Google DeepMindが2024年6月17日に、映像の雰囲気や動きに合わせて音楽や音を生成する「video-to-audio(V2A)」を発表しました。
·gigazine.net·
Google DeepMindが「動画にピッタリな音楽を生成するAI」を発表
Runwayが動画生成AIモデル「Gen-3 Alpha」をリリース、数日以内に誰でも5~10秒の動画生成が利用可能に
Runwayが動画生成AIモデル「Gen-3 Alpha」をリリース、数日以内に誰でも5~10秒の動画生成が利用可能に
AI企業のRunwayが、大規模マルチモーダルトレーニング用に構築された新しいインフラストラクチャでトレーニングした、新しい動画生成AIモデルの「Gen-3 Alpha」を発表しました。
·gigazine.net·
Runwayが動画生成AIモデル「Gen-3 Alpha」をリリース、数日以内に誰でも5~10秒の動画生成が利用可能に
「落書きからイラスト生成」「常にカメラ目線に補正」といったMicrosoft純正AI機能をSnapdragon X Eliteを搭載したCopilot+ PCで使ってみた
「落書きからイラスト生成」「常にカメラ目線に補正」といったMicrosoft純正AI機能をSnapdragon X Eliteを搭載したCopilot+ PCで使ってみた
2024年6月15日、ペイントで書いた落書きから高品質イラストを生成できる「CoCreator」やカメラで撮影した映像をリアルタイム補正できる「スタジオエフェクト」といったAI機能を含む大型Windowsアップデート「Windows 11 バージョン24H2」がリリースされました。Windows 11 バージョン24H2は高性能なAI処理チップを搭載したCopilot+ PCでしか使えないのですが、ちょうどASUSからSnapdragon X Eliteを搭載したノートPC「ASUS Vivobook S 15 S5507QA」が届いたので、AI機能の「CoCreator」「スタジオエフェクト」を使ってみました。
·gigazine.net·
「落書きからイラスト生成」「常にカメラ目線に補正」といったMicrosoft純正AI機能をSnapdragon X Eliteを搭載したCopilot+ PCで使ってみた
【年間ライセンス無料配布あり】AIで画像のクオリティが格段にアップする「Aiarty Image Enhancer」でロスレス拡大やノイズ除去をやってみたよレビュー
【年間ライセンス無料配布あり】AIで画像のクオリティが格段にアップする「Aiarty Image Enhancer」でロスレス拡大やノイズ除去をやってみたよレビュー
写真を撮った時は上出来だと思ったのに、いざSNSやブログにアップロードしようと思ったら、ピンボケや手ぶれでイマイチだったという経験がある人は多いはず。また、「ネット上にあったよさげなイラストをクリックしてみたらサイズが小さくてしょんぼり」というのもよくあります。
·gigazine.net·
【年間ライセンス無料配布あり】AIで画像のクオリティが格段にアップする「Aiarty Image Enhancer」でロスレス拡大やノイズ除去をやってみたよレビュー
画像を3D化する「3Dガウススプリッティング」の精度を飛躍的に向上する手法が開発される
画像を3D化する「3Dガウススプリッティング」の精度を飛躍的に向上する手法が開発される
複数の視点から撮影した画像を組み合わせて奥行きのある映像を生成する「ニューラルレンダリング」の手法の1つである「3Dガウススプリッティング(3D Gaussian Splatting)」のレンダリング品質を飛躍的に高める方法「マルコフ連鎖モンテカルロ法としての3Dガウススプラッティング」を開発したとブリティッシュコロンビア大学とGoogleの研究チームが発表しました。
·gigazine.net·
画像を3D化する「3Dガウススプリッティング」の精度を飛躍的に向上する手法が開発される
イギリスの主要駅でAmazonのAI監視システムが国民への説明なしに導入されていたことが判明
イギリスの主要駅でAmazonのAI監視システムが国民への説明なしに導入されていたことが判明
イギリスの主要駅でAmazonのAIを用いた監視システムが稼働していたことが判明しました。監視システムではカメラで撮影した人物の顔を自動認識して年齢や感情などを読み取っていたそうです。
·gigazine.net·
イギリスの主要駅でAmazonのAI監視システムが国民への説明なしに導入されていたことが判明
イラストの下描きをキレイな線画に整えるAIアプリ「sketch2lineart」使用レビュー、低スペックPCでも問題なし
イラストの下描きをキレイな線画に整えるAIアプリ「sketch2lineart」使用レビュー、低スペックPCでも問題なし
イラストの下描きからキレイな線画を作り出せるAIアプリ「sketch2lineart」が、画像生成AI関連のアプリを開発しているとりにく氏によって公開されました。sketch2lineartはウェブ上に構築されたアプリで、処理がサーバー上で実行されるため低スペックなPCでも問題なくAIを活用できるとのこと。めちゃくちゃ便利そうだったので、実際に下描きを入力して線画を作ってみました。
·gigazine.net·
イラストの下描きをキレイな線画に整えるAIアプリ「sketch2lineart」使用レビュー、低スペックPCでも問題なし
露出やホワイトバランスを画面上に表示して調整も簡単にできる高機能カメラアプリ「Blackmagic Camera」のAndroid版が出たので使ってみた
露出やホワイトバランスを画面上に表示して調整も簡単にできる高機能カメラアプリ「Blackmagic Camera」のAndroid版が出たので使ってみた
プロ向けシネマカメラや動画編集ソフト「DaVinci Resolve」などの開発で知られるBlackmagic Designは、高機能なスマートフォン向けカメラアプリ「Blackmagic Camera」も無料で配布しています。そんなBlackmagic CameraのAndroid版が2024年6月24日(月)に登場したので、実際にインストールしてどんな機能が搭載されているのか確かめてみました。
·gigazine.net·
露出やホワイトバランスを画面上に表示して調整も簡単にできる高機能カメラアプリ「Blackmagic Camera」のAndroid版が出たので使ってみた
30年以上テレビ放送を24時間録画しつづけて7万本のビデオテープに記録した元図書館司書は何をしようとしていたのか?
30年以上テレビ放送を24時間録画しつづけて7万本のビデオテープに記録した元図書館司書は何をしようとしていたのか?
1929年にアメリカ北東部のペンシルバニア州フィラデルフィアで生まれたマリオン・マーガレット・ストークスは、1940年代から1960年代初頭までFree フィラデルフィア自由図書館で司書として働いた後、公民権運動の活動家を経て、1979年から一日中テレビを録画しつづけることに固執したことで知られています。そんなストークスの人生とストークスが残した記録の重要な意義について、主に歴史に関するトピックを扱うメディアのAll That's Interestingが解説しています。
·gigazine.net·
30年以上テレビ放送を24時間録画しつづけて7万本のビデオテープに記録した元図書館司書は何をしようとしていたのか?
MicrosoftのAI責任者が「オープンウェブ上のコンテンツはフリーウェア」と発言、AIトレーニングにウェブ上のコンテンツを利用しても問題ないという考えを強調
MicrosoftのAI責任者が「オープンウェブ上のコンテンツはフリーウェア」と発言、AIトレーニングにウェブ上のコンテンツを利用しても問題ないという考えを強調
Googleに買収されたAIスタートアップ・DeepMindの共同創設者であり、記事作成時点ではMicrosoftのAI開発部門であるMicrosoft AIのムスタファ・スレイマンCEOが、オープンウェブ上にコンテンツを公開した瞬間、誰でも自由にコピーして使用できる「フリーウェア」になるという考えを自身が持っていることを打ち明けました。テクノロジーメディアのThe Vergeは、「誤った考えを持っている」と批判しています。
·gigazine.net·
MicrosoftのAI責任者が「オープンウェブ上のコンテンツはフリーウェア」と発言、AIトレーニングにウェブ上のコンテンツを利用しても問題ないという考えを強調
カンペ見ても「カメラ目線」へ自動補正 動画のAI吹き替えツール「Captions」にPC版、実際に試してみた
カンペ見ても「カメラ目線」へ自動補正 動画のAI吹き替えツール「Captions」にPC版、実際に試してみた
日本語で話す動画を、英語に自動翻訳+アフレコしてくれるツール「Captions」。もともとはiOS版として提供されていたサービスだが、PC版(β版)が登場。AIを使った新機能も含め実際にテストしてみた。
·itmedia.co.jp·
カンペ見ても「カメラ目線」へ自動補正 動画のAI吹き替えツール「Captions」にPC版、実際に試してみた
API経由でいつでもネコを召喚できるサービス「Cat as a service」でいろんなネコを召喚しまくってみた
API経由でいつでもネコを召喚できるサービス「Cat as a service」でいろんなネコを召喚しまくってみた
Microsoft 365などソフトウェアをクラウドサーバーで動作させることでサービスのように扱えるシステムを「Software as a service」というように、「○○ as a service」というのは○○に入るものをサービスとして提供する行為の総称です。「Cat as a service」はいつでもネコを召喚できるシステムということなので、実際に多数のネコを召喚しまくってみました。
·gigazine.net·
API経由でいつでもネコを召喚できるサービス「Cat as a service」でいろんなネコを召喚しまくってみた
鉄道改札で全国初の「顔認証」本格導入、6駅にタブレット8台…従来の切符と定期券の新規発売取りやめ
鉄道改札で全国初の「顔認証」本格導入、6駅にタブレット8台…従来の切符と定期券の新規発売取りやめ
【読売新聞】 千葉県佐倉市のユーカリが丘ニュータウンを走行する鉄道「山万ユーカリが丘線」で15日、顔認証で乗り降りできるシステムが全国で初めて本格導入される。利用者は事前に専用サイトでクレジットカード情報と顔を登録し、改札に設置され
·yomiuri.co.jp·
鉄道改札で全国初の「顔認証」本格導入、6駅にタブレット8台…従来の切符と定期券の新規発売取りやめ
サイバーエージェント、独自の日本語LLMに“視覚”を付与した75億パラメーターの「VLM」を公開
サイバーエージェント、独自の日本語LLMに“視覚”を付与した75億パラメーターの「VLM」を公開
株式会社サイバーエージェントは、75億パラメーターの日本語VLM(大規模視覚言語モデル)のベースモデルをHugging Face Hubで公開した。Apache-2.0ライセンスで提供されており、商用利用も可能だとしている。
·internet.watch.impress.co.jp·
サイバーエージェント、独自の日本語LLMに“視覚”を付与した75億パラメーターの「VLM」を公開
1枚の写真→5秒の動画に “無料”で使える最高水準の動画生成AI「Dream Machine」が話題に
1枚の写真→5秒の動画に “無料”で使える最高水準の動画生成AI「Dream Machine」が話題に
AIスタートアップの米Luma Labsは6月12日(現地時間)、動画生成AIサービス「Dream Machine」を発表した。動画の内容を指示するプロンプトと1枚の写真から5秒の動画を生成する。生成スピードは1コマ1秒としており、120コマを2分で生成できるとしている。
·itmedia.co.jp·
1枚の写真→5秒の動画に “無料”で使える最高水準の動画生成AI「Dream Machine」が話題に
ブラウザ上で動画編集が可能なオープンソースアプリ「omniclip」を使って動画に字幕を付けてみた
ブラウザ上で動画編集が可能なオープンソースアプリ「omniclip」を使って動画に字幕を付けてみた
動画編集アプリは数多くの種類が存在しますが、「動画に字幕だけを付けたい」といったちょっとした編集のために動画編集アプリをインストールするのは面倒です。「omniclip」はブラウザ上で動作するインストール不要の動画編集アプリとのことなので、実際にomniclipを使って動画に字幕を付ける編集をやってみました。
·gigazine.net·
ブラウザ上で動画編集が可能なオープンソースアプリ「omniclip」を使って動画に字幕を付けてみた
パナソニックがミラーレスカメラ「LUMIX S9」の製品サイトでストックフォトの写真を流用していたことを認めて謝罪
パナソニックがミラーレスカメラ「LUMIX S9」の製品サイトでストックフォトの写真を流用していたことを認めて謝罪
パナソニックのフルサイズミラーレス一眼カメラ「LUMIX S9」の製品サイトで、機能説明に使われている写真の多くがストックフォトの写真を流用していたことが判明し、物議を醸しています。騒動を受けて、パナソニックが謝罪文を発表しました。
·gigazine.net·
パナソニックがミラーレスカメラ「LUMIX S9」の製品サイトでストックフォトの写真を流用していたことを認めて謝罪
GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円
GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円
画像認識が可能なオープンソースモデルの「Llama 3-V」が公開されました。Llama 3-Vは、OpenAIのマルチモーダルモデル「GPT4-V」よりも格段に小型で、事前トレーニングにかかる費用は500ドル(約78000円)程度なのにもかかわらず、ほとんどの指標で同等のパフォーマンスを示しています。
·gigazine.net·
GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円