画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2692 bookmarks
Custom sorting
【年間ライセンス無料配布あり】AIで画像のクオリティが格段にアップする「Aiarty Image Enhancer」でロスレス拡大やノイズ除去をやってみたよレビュー
【年間ライセンス無料配布あり】AIで画像のクオリティが格段にアップする「Aiarty Image Enhancer」でロスレス拡大やノイズ除去をやってみたよレビュー
写真を撮った時は上出来だと思ったのに、いざSNSやブログにアップロードしようと思ったら、ピンボケや手ぶれでイマイチだったという経験がある人は多いはず。また、「ネット上にあったよさげなイラストをクリックしてみたらサイズが小さくてしょんぼり」というのもよくあります。
·gigazine.net·
【年間ライセンス無料配布あり】AIで画像のクオリティが格段にアップする「Aiarty Image Enhancer」でロスレス拡大やノイズ除去をやってみたよレビュー
画像を3D化する「3Dガウススプリッティング」の精度を飛躍的に向上する手法が開発される
画像を3D化する「3Dガウススプリッティング」の精度を飛躍的に向上する手法が開発される
複数の視点から撮影した画像を組み合わせて奥行きのある映像を生成する「ニューラルレンダリング」の手法の1つである「3Dガウススプリッティング(3D Gaussian Splatting)」のレンダリング品質を飛躍的に高める方法「マルコフ連鎖モンテカルロ法としての3Dガウススプラッティング」を開発したとブリティッシュコロンビア大学とGoogleの研究チームが発表しました。
·gigazine.net·
画像を3D化する「3Dガウススプリッティング」の精度を飛躍的に向上する手法が開発される
イギリスの主要駅でAmazonのAI監視システムが国民への説明なしに導入されていたことが判明
イギリスの主要駅でAmazonのAI監視システムが国民への説明なしに導入されていたことが判明
イギリスの主要駅でAmazonのAIを用いた監視システムが稼働していたことが判明しました。監視システムではカメラで撮影した人物の顔を自動認識して年齢や感情などを読み取っていたそうです。
·gigazine.net·
イギリスの主要駅でAmazonのAI監視システムが国民への説明なしに導入されていたことが判明
イラストの下描きをキレイな線画に整えるAIアプリ「sketch2lineart」使用レビュー、低スペックPCでも問題なし
イラストの下描きをキレイな線画に整えるAIアプリ「sketch2lineart」使用レビュー、低スペックPCでも問題なし
イラストの下描きからキレイな線画を作り出せるAIアプリ「sketch2lineart」が、画像生成AI関連のアプリを開発しているとりにく氏によって公開されました。sketch2lineartはウェブ上に構築されたアプリで、処理がサーバー上で実行されるため低スペックなPCでも問題なくAIを活用できるとのこと。めちゃくちゃ便利そうだったので、実際に下描きを入力して線画を作ってみました。
·gigazine.net·
イラストの下描きをキレイな線画に整えるAIアプリ「sketch2lineart」使用レビュー、低スペックPCでも問題なし
露出やホワイトバランスを画面上に表示して調整も簡単にできる高機能カメラアプリ「Blackmagic Camera」のAndroid版が出たので使ってみた
露出やホワイトバランスを画面上に表示して調整も簡単にできる高機能カメラアプリ「Blackmagic Camera」のAndroid版が出たので使ってみた
プロ向けシネマカメラや動画編集ソフト「DaVinci Resolve」などの開発で知られるBlackmagic Designは、高機能なスマートフォン向けカメラアプリ「Blackmagic Camera」も無料で配布しています。そんなBlackmagic CameraのAndroid版が2024年6月24日(月)に登場したので、実際にインストールしてどんな機能が搭載されているのか確かめてみました。
·gigazine.net·
露出やホワイトバランスを画面上に表示して調整も簡単にできる高機能カメラアプリ「Blackmagic Camera」のAndroid版が出たので使ってみた
30年以上テレビ放送を24時間録画しつづけて7万本のビデオテープに記録した元図書館司書は何をしようとしていたのか?
30年以上テレビ放送を24時間録画しつづけて7万本のビデオテープに記録した元図書館司書は何をしようとしていたのか?
1929年にアメリカ北東部のペンシルバニア州フィラデルフィアで生まれたマリオン・マーガレット・ストークスは、1940年代から1960年代初頭までFree フィラデルフィア自由図書館で司書として働いた後、公民権運動の活動家を経て、1979年から一日中テレビを録画しつづけることに固執したことで知られています。そんなストークスの人生とストークスが残した記録の重要な意義について、主に歴史に関するトピックを扱うメディアのAll That's Interestingが解説しています。
·gigazine.net·
30年以上テレビ放送を24時間録画しつづけて7万本のビデオテープに記録した元図書館司書は何をしようとしていたのか?
MicrosoftのAI責任者が「オープンウェブ上のコンテンツはフリーウェア」と発言、AIトレーニングにウェブ上のコンテンツを利用しても問題ないという考えを強調
MicrosoftのAI責任者が「オープンウェブ上のコンテンツはフリーウェア」と発言、AIトレーニングにウェブ上のコンテンツを利用しても問題ないという考えを強調
Googleに買収されたAIスタートアップ・DeepMindの共同創設者であり、記事作成時点ではMicrosoftのAI開発部門であるMicrosoft AIのムスタファ・スレイマンCEOが、オープンウェブ上にコンテンツを公開した瞬間、誰でも自由にコピーして使用できる「フリーウェア」になるという考えを自身が持っていることを打ち明けました。テクノロジーメディアのThe Vergeは、「誤った考えを持っている」と批判しています。
·gigazine.net·
MicrosoftのAI責任者が「オープンウェブ上のコンテンツはフリーウェア」と発言、AIトレーニングにウェブ上のコンテンツを利用しても問題ないという考えを強調
カンペ見ても「カメラ目線」へ自動補正 動画のAI吹き替えツール「Captions」にPC版、実際に試してみた
カンペ見ても「カメラ目線」へ自動補正 動画のAI吹き替えツール「Captions」にPC版、実際に試してみた
日本語で話す動画を、英語に自動翻訳+アフレコしてくれるツール「Captions」。もともとはiOS版として提供されていたサービスだが、PC版(β版)が登場。AIを使った新機能も含め実際にテストしてみた。
·itmedia.co.jp·
カンペ見ても「カメラ目線」へ自動補正 動画のAI吹き替えツール「Captions」にPC版、実際に試してみた
API経由でいつでもネコを召喚できるサービス「Cat as a service」でいろんなネコを召喚しまくってみた
API経由でいつでもネコを召喚できるサービス「Cat as a service」でいろんなネコを召喚しまくってみた
Microsoft 365などソフトウェアをクラウドサーバーで動作させることでサービスのように扱えるシステムを「Software as a service」というように、「○○ as a service」というのは○○に入るものをサービスとして提供する行為の総称です。「Cat as a service」はいつでもネコを召喚できるシステムということなので、実際に多数のネコを召喚しまくってみました。
·gigazine.net·
API経由でいつでもネコを召喚できるサービス「Cat as a service」でいろんなネコを召喚しまくってみた
鉄道改札で全国初の「顔認証」本格導入、6駅にタブレット8台…従来の切符と定期券の新規発売取りやめ
鉄道改札で全国初の「顔認証」本格導入、6駅にタブレット8台…従来の切符と定期券の新規発売取りやめ
【読売新聞】 千葉県佐倉市のユーカリが丘ニュータウンを走行する鉄道「山万ユーカリが丘線」で15日、顔認証で乗り降りできるシステムが全国で初めて本格導入される。利用者は事前に専用サイトでクレジットカード情報と顔を登録し、改札に設置され
·yomiuri.co.jp·
鉄道改札で全国初の「顔認証」本格導入、6駅にタブレット8台…従来の切符と定期券の新規発売取りやめ
サイバーエージェント、独自の日本語LLMに“視覚”を付与した75億パラメーターの「VLM」を公開
サイバーエージェント、独自の日本語LLMに“視覚”を付与した75億パラメーターの「VLM」を公開
株式会社サイバーエージェントは、75億パラメーターの日本語VLM(大規模視覚言語モデル)のベースモデルをHugging Face Hubで公開した。Apache-2.0ライセンスで提供されており、商用利用も可能だとしている。
·internet.watch.impress.co.jp·
サイバーエージェント、独自の日本語LLMに“視覚”を付与した75億パラメーターの「VLM」を公開
1枚の写真→5秒の動画に “無料”で使える最高水準の動画生成AI「Dream Machine」が話題に
1枚の写真→5秒の動画に “無料”で使える最高水準の動画生成AI「Dream Machine」が話題に
AIスタートアップの米Luma Labsは6月12日(現地時間)、動画生成AIサービス「Dream Machine」を発表した。動画の内容を指示するプロンプトと1枚の写真から5秒の動画を生成する。生成スピードは1コマ1秒としており、120コマを2分で生成できるとしている。
·itmedia.co.jp·
1枚の写真→5秒の動画に “無料”で使える最高水準の動画生成AI「Dream Machine」が話題に
ブラウザ上で動画編集が可能なオープンソースアプリ「omniclip」を使って動画に字幕を付けてみた
ブラウザ上で動画編集が可能なオープンソースアプリ「omniclip」を使って動画に字幕を付けてみた
動画編集アプリは数多くの種類が存在しますが、「動画に字幕だけを付けたい」といったちょっとした編集のために動画編集アプリをインストールするのは面倒です。「omniclip」はブラウザ上で動作するインストール不要の動画編集アプリとのことなので、実際にomniclipを使って動画に字幕を付ける編集をやってみました。
·gigazine.net·
ブラウザ上で動画編集が可能なオープンソースアプリ「omniclip」を使って動画に字幕を付けてみた
パナソニックがミラーレスカメラ「LUMIX S9」の製品サイトでストックフォトの写真を流用していたことを認めて謝罪
パナソニックがミラーレスカメラ「LUMIX S9」の製品サイトでストックフォトの写真を流用していたことを認めて謝罪
パナソニックのフルサイズミラーレス一眼カメラ「LUMIX S9」の製品サイトで、機能説明に使われている写真の多くがストックフォトの写真を流用していたことが判明し、物議を醸しています。騒動を受けて、パナソニックが謝罪文を発表しました。
·gigazine.net·
パナソニックがミラーレスカメラ「LUMIX S9」の製品サイトでストックフォトの写真を流用していたことを認めて謝罪
GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円
GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円
画像認識が可能なオープンソースモデルの「Llama 3-V」が公開されました。Llama 3-Vは、OpenAIのマルチモーダルモデル「GPT4-V」よりも格段に小型で、事前トレーニングにかかる費用は500ドル(約78000円)程度なのにもかかわらず、ほとんどの指標で同等のパフォーマンスを示しています。
·gigazine.net·
GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円
テスラ車の自動ワイパーがうまく動作しないのは「カメラ重視」の方針のせいだという指摘
テスラ車の自動ワイパーがうまく動作しないのは「カメラ重視」の方針のせいだという指摘
多くの現代車にはフロントガラスに落ちた雨滴を感知して動く自動ワイパー機能が搭載されていますが、テスラ車の自動ワイパー機能は性能が低いことが以前から指摘されています。一体なぜテスラ車の自動ワイパー機能がうまく動作しないのか、どうして問題の修正が難しいのかについて、テスラ関連の話題を取り上げるウェブメディアのNot a Tesla Appが解説しました。
·gigazine.net·
テスラ車の自動ワイパーがうまく動作しないのは「カメラ重視」の方針のせいだという指摘
Amazonの倉庫で出荷前に製品が破損・欠損しているかどうかを自動チェックするAI「Project P.I.」の仕組み
Amazonの倉庫で出荷前に製品が破損・欠損しているかどうかを自動チェックするAI「Project P.I.」の仕組み
Amazonは生成AIと画像認識を使って、発送前の製品に破損したものや色・サイズが間違っているものがないかをチェックするシステム「Project P.I.」を発表しました。Project P.I.はすでにアメリカの一部フルフィルメントセンターで導入されているとのことです。
·gigazine.net·
Amazonの倉庫で出荷前に製品が破損・欠損しているかどうかを自動チェックするAI「Project P.I.」の仕組み
プライベートなメールや画像をスキャンするEUの「チャット規制法」成立が秒読みか、メッセージアプリ「Signal」はEU離脱を示唆
プライベートなメールや画像をスキャンするEUの「チャット規制法」成立が秒読みか、メッセージアプリ「Signal」はEU離脱を示唆
EUでは、児童性的虐待防止を目的に通話やメール、メッセージなどのスキャンを企業に義務付ける「Chat Control(チャット規制法)」の議論が進んでいますが、この法律は専門家や有識者、活動家などからプライバシーを損ない児童福祉にも逆効果であるとして批判されています。法案反対派の牙城とされてきたフランス当局が、スキャンに同意しなければメッセージが送れなくなる「アップロード・モデレーション」を含む妥協案を採用する方針をまとめたことを受けて、プライバシーに特化したメッセージアプリのSignalが、法律が成立した場合はEU市場から撤退すると表明しました。
·gigazine.net·
プライベートなメールや画像をスキャンするEUの「チャット規制法」成立が秒読みか、メッセージアプリ「Signal」はEU離脱を示唆
ウガンダ政府が国家発行のIDカードと生体認証システムを悪用して人権活動家やジャーナリストなどを監視しているとの指摘
ウガンダ政府が国家発行のIDカードと生体認証システムを悪用して人権活動家やジャーナリストなどを監視しているとの指摘
アフリカ東部の内陸国・ウガンダ共和国では顔や指紋、虹彩など、一人一人固有の身体的な特徴を記録し、個人を識別する生体認証ツールの構築が進められています。しかし、ウガンダ政府はこのツールを政治家やジャーナリスト、人権活動家、一般市民を監視するためのツールとしても活用していることが指摘されています。
·gigazine.net·
ウガンダ政府が国家発行のIDカードと生体認証システムを悪用して人権活動家やジャーナリストなどを監視しているとの指摘
Adobeが「ユーザー生成コンテンツに自由にアクセス・活用」できるように新しい利用規約を導入、クリエイターから批判の声が集まる
Adobeが「ユーザー生成コンテンツに自由にアクセス・活用」できるように新しい利用規約を導入、クリエイターから批判の声が集まる
画像編集ツールのPhotoshopや動画編集ツールのPremiere Proなどを提供するAdobeが、Adobe Creative Cloudの利用規約を「ユーザーが作成しているプロジェクトにAdobeが自由にアクセスできるように」改定しました。
·gigazine.net·
Adobeが「ユーザー生成コンテンツに自由にアクセス・活用」できるように新しい利用規約を導入、クリエイターから批判の声が集まる
Amazonプライムビデオで映画「十二人の怒れる男」のサムネイルがAI生成画像になっていて「19人いる」と指摘あり
Amazonプライムビデオで映画「十二人の怒れる男」のサムネイルがAI生成画像になっていて「19人いる」と指摘あり
Amazonの動画配信サービスで、映画「十二人の怒れる男(原題:12 Angry Men)」のサムネイル画像が、作品とは関係ないAI生成の画像になっていることが指摘されています。
·gigazine.net·
Amazonプライムビデオで映画「十二人の怒れる男」のサムネイルがAI生成画像になっていて「19人いる」と指摘あり
MetaのAI施策に反発する形でアンチAIプラットフォーム「Cara」のユーザー数が1週間で17倍超に増加
MetaのAI施策に反発する形でアンチAIプラットフォーム「Cara」のユーザー数が1週間で17倍超に増加
Metaが推し進める「コンテンツをAIトレーニングの素材として使っていく」施策に反発する形で、アーティストが中心となって設立したプラットフォーム「Cara」のユーザー数が、直近の1週間で4万人から70万人へ、17.5倍に増えたことがわかりました。
·gigazine.net·
MetaのAI施策に反発する形でアンチAIプラットフォーム「Cara」のユーザー数が1週間で17倍超に増加
Adobeがユーザー生成コンテンツに自由にアクセス・活用できるよう利用規約を更新した件について正式に説明
Adobeがユーザー生成コンテンツに自由にアクセス・活用できるよう利用規約を更新した件について正式に説明
「Adobeがユーザー生成コンテンツに自由にアクセス・活用できるよう利用規約を更新した」として、一部のクリエイターから批判の声が集まっています。この件について、Adobeが利用規約を更新した理由や、ユーザーコンテンツへのアクセス権限を求める理由について説明するブログを更新しました。
·gigazine.net·
Adobeがユーザー生成コンテンツに自由にアクセス・活用できるよう利用規約を更新した件について正式に説明
ロシアのウクライナ侵攻後にAmazonがロシア企業に顔認識技術を提供し制裁に違反したとAWSの元従業員が告発
ロシアのウクライナ侵攻後にAmazonがロシア企業に顔認識技術を提供し制裁に違反したとAWSの元従業員が告発
2022年にロシアがウクライナ侵攻を始めて以降、ロシアは世界中の各国から制裁を受けています。世界的なテクノロジー企業であるAmazonが、ロシアに制裁が課されたあとに同国に顔認証技術を販売したと、Amazon Web Services(AWS)の元従業員がリークしました。
·gigazine.net·
ロシアのウクライナ侵攻後にAmazonがロシア企業に顔認識技術を提供し制裁に違反したとAWSの元従業員が告発
Adobeが「ユーザーコンテンツをAI学習しない」と明記する形へ利用規約を再度全面見直し
Adobeが「ユーザーコンテンツをAI学習しない」と明記する形へ利用規約を再度全面見直し
2024年6月に更新されたAdobe Creative Cloudの利用規約にある「ユーザーコンテンツにAdobeがアクセスする可能性がある」という文言が大きく批判を浴びたことを受け、Adobeが利用規約の各項目について明確化することを約束しました。これにより、ユーザーが作成したコンテンツがAI学習に使用されないこと等が明記されます。
·gigazine.net·
Adobeが「ユーザーコンテンツをAI学習しない」と明記する形へ利用規約を再度全面見直し
画像生成AIのStable Diffusionなどに使われるデータセット「LAION-5B」に同意のない子どもの写真が含まれており身元まで特定可能
画像生成AIのStable Diffusionなどに使われるデータセット「LAION-5B」に同意のない子どもの写真が含まれており身元まで特定可能
画像生成AIのStable Diffusionなどのトレーニングには、約58億5000万もの画像とテキストの組み合わせからなるデータセット「LAION-5B」が用いられています。新たに人権NGOのヒューマン・ライツ・ウォッチ(HRW)が、LAION-5Bにはブラジルの子どもたちの写真が同意なしで使われており、多くの子どもたちは身元まで追跡可能であると報告しました。
·gigazine.net·
画像生成AIのStable Diffusionなどに使われるデータセット「LAION-5B」に同意のない子どもの写真が含まれており身元まで特定可能
Apple Vision Proの「空間ビデオ」コンテンツを撮影可能な3Dカメラ「Blackmagic URSA Cine Immersive」が発表される
Apple Vision Proの「空間ビデオ」コンテンツを撮影可能な3Dカメラ「Blackmagic URSA Cine Immersive」が発表される
Appleの空間コンピューティングデバイス「Apple Vision Pro」のVRビデオであるImmersive Video(空間ビデオ)の撮影に対応したカメラ「Blackmagic URSA Cine Immersive」を、映像機器メーカー「BlackMagic Design」が発表しました。Blackmagic URSA Cine Immersiveは空間ビデオの撮影専用に設計された固定式のカスタムレンズシステムを搭載し、両目それぞれ8160×7200ピクセルの解像度、16ストップのダイナミックレンジで3Dの空間ビデオコンテンツを作成可能とのことです。
·gigazine.net·
Apple Vision Proの「空間ビデオ」コンテンツを撮影可能な3Dカメラ「Blackmagic URSA Cine Immersive」が発表される
YouTubeが動画のサムネイル画像のテストと比較ができる機能を全クリエイターへ展開予定
YouTubeが動画のサムネイル画像のテストと比較ができる機能を全クリエイターへ展開予定
YouTube動画の「サムネイル」は動画の内容を一番わかりやすく視覚的に宣伝することができる要素の1つで、YouTubeで活動する多くのクリエイターがこのサムネイルの作成に四苦八苦しています。YouTubeが、今後3枚のサムネイルでA/Bテストを行う機能を2024年7月までにすべてのクリエイターに展開すると発表しました。
·gigazine.net·
YouTubeが動画のサムネイル画像のテストと比較ができる機能を全クリエイターへ展開予定