画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2587 bookmarks
Custom sorting
テスラ車の自動ワイパーがうまく動作しないのは「カメラ重視」の方針のせいだという指摘
テスラ車の自動ワイパーがうまく動作しないのは「カメラ重視」の方針のせいだという指摘
多くの現代車にはフロントガラスに落ちた雨滴を感知して動く自動ワイパー機能が搭載されていますが、テスラ車の自動ワイパー機能は性能が低いことが以前から指摘されています。一体なぜテスラ車の自動ワイパー機能がうまく動作しないのか、どうして問題の修正が難しいのかについて、テスラ関連の話題を取り上げるウェブメディアのNot a Tesla Appが解説しました。
·gigazine.net·
テスラ車の自動ワイパーがうまく動作しないのは「カメラ重視」の方針のせいだという指摘
Amazonの倉庫で出荷前に製品が破損・欠損しているかどうかを自動チェックするAI「Project P.I.」の仕組み
Amazonの倉庫で出荷前に製品が破損・欠損しているかどうかを自動チェックするAI「Project P.I.」の仕組み
Amazonは生成AIと画像認識を使って、発送前の製品に破損したものや色・サイズが間違っているものがないかをチェックするシステム「Project P.I.」を発表しました。Project P.I.はすでにアメリカの一部フルフィルメントセンターで導入されているとのことです。
·gigazine.net·
Amazonの倉庫で出荷前に製品が破損・欠損しているかどうかを自動チェックするAI「Project P.I.」の仕組み
プライベートなメールや画像をスキャンするEUの「チャット規制法」成立が秒読みか、メッセージアプリ「Signal」はEU離脱を示唆
プライベートなメールや画像をスキャンするEUの「チャット規制法」成立が秒読みか、メッセージアプリ「Signal」はEU離脱を示唆
EUでは、児童性的虐待防止を目的に通話やメール、メッセージなどのスキャンを企業に義務付ける「Chat Control(チャット規制法)」の議論が進んでいますが、この法律は専門家や有識者、活動家などからプライバシーを損ない児童福祉にも逆効果であるとして批判されています。法案反対派の牙城とされてきたフランス当局が、スキャンに同意しなければメッセージが送れなくなる「アップロード・モデレーション」を含む妥協案を採用する方針をまとめたことを受けて、プライバシーに特化したメッセージアプリのSignalが、法律が成立した場合はEU市場から撤退すると表明しました。
·gigazine.net·
プライベートなメールや画像をスキャンするEUの「チャット規制法」成立が秒読みか、メッセージアプリ「Signal」はEU離脱を示唆
ウガンダ政府が国家発行のIDカードと生体認証システムを悪用して人権活動家やジャーナリストなどを監視しているとの指摘
ウガンダ政府が国家発行のIDカードと生体認証システムを悪用して人権活動家やジャーナリストなどを監視しているとの指摘
アフリカ東部の内陸国・ウガンダ共和国では顔や指紋、虹彩など、一人一人固有の身体的な特徴を記録し、個人を識別する生体認証ツールの構築が進められています。しかし、ウガンダ政府はこのツールを政治家やジャーナリスト、人権活動家、一般市民を監視するためのツールとしても活用していることが指摘されています。
·gigazine.net·
ウガンダ政府が国家発行のIDカードと生体認証システムを悪用して人権活動家やジャーナリストなどを監視しているとの指摘
Adobeが「ユーザー生成コンテンツに自由にアクセス・活用」できるように新しい利用規約を導入、クリエイターから批判の声が集まる
Adobeが「ユーザー生成コンテンツに自由にアクセス・活用」できるように新しい利用規約を導入、クリエイターから批判の声が集まる
画像編集ツールのPhotoshopや動画編集ツールのPremiere Proなどを提供するAdobeが、Adobe Creative Cloudの利用規約を「ユーザーが作成しているプロジェクトにAdobeが自由にアクセスできるように」改定しました。
·gigazine.net·
Adobeが「ユーザー生成コンテンツに自由にアクセス・活用」できるように新しい利用規約を導入、クリエイターから批判の声が集まる
Amazonプライムビデオで映画「十二人の怒れる男」のサムネイルがAI生成画像になっていて「19人いる」と指摘あり
Amazonプライムビデオで映画「十二人の怒れる男」のサムネイルがAI生成画像になっていて「19人いる」と指摘あり
Amazonの動画配信サービスで、映画「十二人の怒れる男(原題:12 Angry Men)」のサムネイル画像が、作品とは関係ないAI生成の画像になっていることが指摘されています。
·gigazine.net·
Amazonプライムビデオで映画「十二人の怒れる男」のサムネイルがAI生成画像になっていて「19人いる」と指摘あり
MetaのAI施策に反発する形でアンチAIプラットフォーム「Cara」のユーザー数が1週間で17倍超に増加
MetaのAI施策に反発する形でアンチAIプラットフォーム「Cara」のユーザー数が1週間で17倍超に増加
Metaが推し進める「コンテンツをAIトレーニングの素材として使っていく」施策に反発する形で、アーティストが中心となって設立したプラットフォーム「Cara」のユーザー数が、直近の1週間で4万人から70万人へ、17.5倍に増えたことがわかりました。
·gigazine.net·
MetaのAI施策に反発する形でアンチAIプラットフォーム「Cara」のユーザー数が1週間で17倍超に増加
Adobeがユーザー生成コンテンツに自由にアクセス・活用できるよう利用規約を更新した件について正式に説明
Adobeがユーザー生成コンテンツに自由にアクセス・活用できるよう利用規約を更新した件について正式に説明
「Adobeがユーザー生成コンテンツに自由にアクセス・活用できるよう利用規約を更新した」として、一部のクリエイターから批判の声が集まっています。この件について、Adobeが利用規約を更新した理由や、ユーザーコンテンツへのアクセス権限を求める理由について説明するブログを更新しました。
·gigazine.net·
Adobeがユーザー生成コンテンツに自由にアクセス・活用できるよう利用規約を更新した件について正式に説明
ロシアのウクライナ侵攻後にAmazonがロシア企業に顔認識技術を提供し制裁に違反したとAWSの元従業員が告発
ロシアのウクライナ侵攻後にAmazonがロシア企業に顔認識技術を提供し制裁に違反したとAWSの元従業員が告発
2022年にロシアがウクライナ侵攻を始めて以降、ロシアは世界中の各国から制裁を受けています。世界的なテクノロジー企業であるAmazonが、ロシアに制裁が課されたあとに同国に顔認証技術を販売したと、Amazon Web Services(AWS)の元従業員がリークしました。
·gigazine.net·
ロシアのウクライナ侵攻後にAmazonがロシア企業に顔認識技術を提供し制裁に違反したとAWSの元従業員が告発
Adobeが「ユーザーコンテンツをAI学習しない」と明記する形へ利用規約を再度全面見直し
Adobeが「ユーザーコンテンツをAI学習しない」と明記する形へ利用規約を再度全面見直し
2024年6月に更新されたAdobe Creative Cloudの利用規約にある「ユーザーコンテンツにAdobeがアクセスする可能性がある」という文言が大きく批判を浴びたことを受け、Adobeが利用規約の各項目について明確化することを約束しました。これにより、ユーザーが作成したコンテンツがAI学習に使用されないこと等が明記されます。
·gigazine.net·
Adobeが「ユーザーコンテンツをAI学習しない」と明記する形へ利用規約を再度全面見直し
画像生成AIのStable Diffusionなどに使われるデータセット「LAION-5B」に同意のない子どもの写真が含まれており身元まで特定可能
画像生成AIのStable Diffusionなどに使われるデータセット「LAION-5B」に同意のない子どもの写真が含まれており身元まで特定可能
画像生成AIのStable Diffusionなどのトレーニングには、約58億5000万もの画像とテキストの組み合わせからなるデータセット「LAION-5B」が用いられています。新たに人権NGOのヒューマン・ライツ・ウォッチ(HRW)が、LAION-5Bにはブラジルの子どもたちの写真が同意なしで使われており、多くの子どもたちは身元まで追跡可能であると報告しました。
·gigazine.net·
画像生成AIのStable Diffusionなどに使われるデータセット「LAION-5B」に同意のない子どもの写真が含まれており身元まで特定可能
Apple Vision Proの「空間ビデオ」コンテンツを撮影可能な3Dカメラ「Blackmagic URSA Cine Immersive」が発表される
Apple Vision Proの「空間ビデオ」コンテンツを撮影可能な3Dカメラ「Blackmagic URSA Cine Immersive」が発表される
Appleの空間コンピューティングデバイス「Apple Vision Pro」のVRビデオであるImmersive Video(空間ビデオ)の撮影に対応したカメラ「Blackmagic URSA Cine Immersive」を、映像機器メーカー「BlackMagic Design」が発表しました。Blackmagic URSA Cine Immersiveは空間ビデオの撮影専用に設計された固定式のカスタムレンズシステムを搭載し、両目それぞれ8160×7200ピクセルの解像度、16ストップのダイナミックレンジで3Dの空間ビデオコンテンツを作成可能とのことです。
·gigazine.net·
Apple Vision Proの「空間ビデオ」コンテンツを撮影可能な3Dカメラ「Blackmagic URSA Cine Immersive」が発表される
YouTubeが動画のサムネイル画像のテストと比較ができる機能を全クリエイターへ展開予定
YouTubeが動画のサムネイル画像のテストと比較ができる機能を全クリエイターへ展開予定
YouTube動画の「サムネイル」は動画の内容を一番わかりやすく視覚的に宣伝することができる要素の1つで、YouTubeで活動する多くのクリエイターがこのサムネイルの作成に四苦八苦しています。YouTubeが、今後3枚のサムネイルでA/Bテストを行う機能を2024年7月までにすべてのクリエイターに展開すると発表しました。
·gigazine.net·
YouTubeが動画のサムネイル画像のテストと比較ができる機能を全クリエイターへ展開予定
シャツのボタンに隠した超小型カメラ付きAIデバイスでカンニングした学生が逮捕される
シャツのボタンに隠した超小型カメラ付きAIデバイスでカンニングした学生が逮捕される
シャツのボタンに小型のカメラを隠し、自作のAIデバイスでカンニングを行ったとして、トルコの学生が身柄を拘束されました。学生は大学試験の最中に不審な行動をしているところを発見され、逮捕されたとのことです。
·gigazine.net·
シャツのボタンに隠した超小型カメラ付きAIデバイスでカンニングした学生が逮捕される
Luma AIが動画生成AIモデルの「Dream Machine」をリリース、誰でも無料で月に30本まで動画生成可能
Luma AIが動画生成AIモデルの「Dream Machine」をリリース、誰でも無料で月に30本まで動画生成可能
2024年6月13日、AI開発企業のLuma AIが、テキストおよび画像から高品質でリアルな動画を生成することができる次世代動画生成AIモデルの「Dream Machine」をリリースしました。
·gigazine.net·
Luma AIが動画生成AIモデルの「Dream Machine」をリリース、誰でも無料で月に30本まで動画生成可能
YouTubeがユーザーの「見たいもの」を予測して一番見られている場所までスキップする「Jump Ahead」機能のテスト範囲を拡大
YouTubeがユーザーの「見たいもの」を予測して一番見られている場所までスキップする「Jump Ahead」機能のテスト範囲を拡大
YouTubeが、AIを用いた「Jump Ahead」機能のテストの対象を、アメリカの一部のYouTube Premiumメンバーから、アメリカのYouTube Premiumメンバー全体に拡大したことがわかりました。
·gigazine.net·
YouTubeがユーザーの「見たいもの」を予測して一番見られている場所までスキップする「Jump Ahead」機能のテスト範囲を拡大
OpenAIが「AI生成画像かどうかを見分けるツール」を開発中
OpenAIが「AI生成画像かどうかを見分けるツール」を開発中
OpenAIが2024年5月7日に、デジタルコンテンツの来歴を追跡する技術の標準化団体「Coalition for Content Provenance and Authenticity(C2PA)」に参加したことを発表しました。Adobe、Microsoft、Google、ソニーなどの後に続いてC2PAの運営に加わったOpenAIは今後、電子透かしやAI画像検知ツールなどの技術の実装に取り組んでいくと表明しています。
·gigazine.net·
OpenAIが「AI生成画像かどうかを見分けるツール」を開発中
製品の宣伝やアピールに最適な画像やテキストの生成を行う広告主向け生成AIツールの強化をMetaが発表
製品の宣伝やアピールに最適な画像やテキストの生成を行う広告主向け生成AIツールの強化をMetaが発表
Metaが、広告主向けに提供している生成AIツールの拡張セットを発表しました。これにより、広告を出したいという人や企業は、宣伝したい製品・サービスを用いたまったく新しい画像を作り出すことができるようになります。
·gigazine.net·
製品の宣伝やアピールに最適な画像やテキストの生成を行う広告主向け生成AIツールの強化をMetaが発表
光源を指定して画像の背景を違和感なく変更できる生成AIツール「IC-Light」をControlNetの作者が公開したので使ってみた
光源を指定して画像の背景を違和感なく変更できる生成AIツール「IC-Light」をControlNetの作者が公開したので使ってみた
ControlNetの開発者として知られるLvmin Zhang氏が、画像の光源の位置や光源の種類を自由に指定できる画像編集AIツール「IC-Light」を公開しました。
·gigazine.net·
光源を指定して画像の背景を違和感なく変更できる生成AIツール「IC-Light」をControlNetの作者が公開したので使ってみた
価格差4万円の「Google Pixel 8a」と「Google Pixel 8」はカメラ性能にどれだけ差があるのか徹底的に検証してみた
価格差4万円の「Google Pixel 8a」と「Google Pixel 8」はカメラ性能にどれだけ差があるのか徹底的に検証してみた
2024年5月14日(火)にリリースされる「Google Pixel 8a」はGoogle Pixel 8と比べて4万円以上安価ながら、同等の処理性能を備えています。「カメラ性能はどれだけ差があるのかな?」という疑問を解決するべく、両スマートフォンで色んな被写体を撮影しまくって性能の違いを検証してみました。
·gigazine.net·
価格差4万円の「Google Pixel 8a」と「Google Pixel 8」はカメラ性能にどれだけ差があるのか徹底的に検証してみた
OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能
OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能
OpenAIが日本時間の2024年5月14日(火)にAIモデル「GPT-4o」を発表しました。GPT-4oは単一のモデルでテキスト、音声、視覚入力を非常に高速に処理可能で、リアルタイムに会話しながら「計算問題を解く」「画像の生成」「周囲の映像から状況を判断」といったタスクを実行可能です。
·gigazine.net·
OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能
Googleが「動画で検索する機能」を発表するもデモ動画に致命的なミスが見つかる
Googleが「動画で検索する機能」を発表するもデモ動画に致命的なミスが見つかる
Googleが生成AIを用いた複数の検索機能を2024年5月15日(水)に開催された「Google I/O 2024」の基調講演で発表しました。この発表には「撮影した動画をもとに検索する機能」が含まれていたのですが、当該機能のデモ動画に致命的なミスが含まれていることが話題となっています。
·gigazine.net·
Googleが「動画で検索する機能」を発表するもデモ動画に致命的なミスが見つかる
Googleが映像と音声を理解して質問に答えるGPT-4oっぽいAIエージェント「Project Astra」を発表
Googleが映像と音声を理解して質問に答えるGPT-4oっぽいAIエージェント「Project Astra」を発表
Googleが現地時間の2024年5月14日に開催した開発者向けイベントの「Google I/O」で、映像や音声を理解してリアルタイムで質問に答えてくれるAIエージェント「Project Astra(Astra)」を発表しました。実際に、ユーザーがスマートフォンとスマートグラスのカメラで撮影した物事について、Astraにあれこれ質問しているデモ動画も公開されています。
·gigazine.net·
Googleが映像と音声を理解して質問に答えるGPT-4oっぽいAIエージェント「Project Astra」を発表
GoogleがAIによる「詐欺電話の検出」や「YouTubeの動画からの検索」機能を発表
GoogleがAIによる「詐欺電話の検出」や「YouTubeの動画からの検索」機能を発表
Googleが、2024年5月14日に開催した開発者カンファレンス「Google I/O 2024」で、AIモデルのGeminiとAndroidをより深く統合させることで、動画からの検索やPDFの要約、銀行員などを装って個人情報を要求する詐欺への警告などの機能がスマートフォンに搭載されることを発表しました。
·gigazine.net·
GoogleがAIによる「詐欺電話の検出」や「YouTubeの動画からの検索」機能を発表
Googleがオープンソースのビジュアル言語モデル「PaliGemma」を公開&Llama 3と同等性能の大規模言語モデル「Gemma 2」を発表
Googleがオープンソースのビジュアル言語モデル「PaliGemma」を公開&Llama 3と同等性能の大規模言語モデル「Gemma 2」を発表
Googleが2024年5月15日にビジュアル言語モデル(VLM)の「PaliGemma」と、大規模言語モデル(LLM)の「Gemma 2」を発表しました。PaliGemmaはすでにリリースされており、簡単に試せるデモも公開されています。
·gigazine.net·
Googleがオープンソースのビジュアル言語モデル「PaliGemma」を公開&Llama 3と同等性能の大規模言語モデル「Gemma 2」を発表
Googleフォトに「これまで訪れた国立公園の中で最高の写真を見せて」などの質問に答えてくれるAI機能「Ask Photos」が導入される
Googleフォトに「これまで訪れた国立公園の中で最高の写真を見せて」などの質問に答えてくれるAI機能「Ask Photos」が導入される
GoogleフォトにAIの「Gemini」が統合され、ユーザーが質問を投げかけるだけで過去に撮影した写真や動画を簡単に検索できるようになることが明らかになりました。
·gigazine.net·
Googleフォトに「これまで訪れた国立公園の中で最高の写真を見せて」などの質問に答えてくれるAI機能「Ask Photos」が導入される