Found 2330 bookmarks
Newest
YouTubeがユーザーの「見たいもの」を予測して一番見られている場所までスキップする「Jump Ahead」機能のテスト範囲を拡大
YouTubeがユーザーの「見たいもの」を予測して一番見られている場所までスキップする「Jump Ahead」機能のテスト範囲を拡大
YouTubeが、AIを用いた「Jump Ahead」機能のテストの対象を、アメリカの一部のYouTube Premiumメンバーから、アメリカのYouTube Premiumメンバー全体に拡大したことがわかりました。
·gigazine.net·
YouTubeがユーザーの「見たいもの」を予測して一番見られている場所までスキップする「Jump Ahead」機能のテスト範囲を拡大
OpenAIが「AI生成画像かどうかを見分けるツール」を開発中
OpenAIが「AI生成画像かどうかを見分けるツール」を開発中
OpenAIが2024年5月7日に、デジタルコンテンツの来歴を追跡する技術の標準化団体「Coalition for Content Provenance and Authenticity(C2PA)」に参加したことを発表しました。Adobe、Microsoft、Google、ソニーなどの後に続いてC2PAの運営に加わったOpenAIは今後、電子透かしやAI画像検知ツールなどの技術の実装に取り組んでいくと表明しています。
·gigazine.net·
OpenAIが「AI生成画像かどうかを見分けるツール」を開発中
製品の宣伝やアピールに最適な画像やテキストの生成を行う広告主向け生成AIツールの強化をMetaが発表
製品の宣伝やアピールに最適な画像やテキストの生成を行う広告主向け生成AIツールの強化をMetaが発表
Metaが、広告主向けに提供している生成AIツールの拡張セットを発表しました。これにより、広告を出したいという人や企業は、宣伝したい製品・サービスを用いたまったく新しい画像を作り出すことができるようになります。
·gigazine.net·
製品の宣伝やアピールに最適な画像やテキストの生成を行う広告主向け生成AIツールの強化をMetaが発表
光源を指定して画像の背景を違和感なく変更できる生成AIツール「IC-Light」をControlNetの作者が公開したので使ってみた
光源を指定して画像の背景を違和感なく変更できる生成AIツール「IC-Light」をControlNetの作者が公開したので使ってみた
ControlNetの開発者として知られるLvmin Zhang氏が、画像の光源の位置や光源の種類を自由に指定できる画像編集AIツール「IC-Light」を公開しました。
·gigazine.net·
光源を指定して画像の背景を違和感なく変更できる生成AIツール「IC-Light」をControlNetの作者が公開したので使ってみた
価格差4万円の「Google Pixel 8a」と「Google Pixel 8」はカメラ性能にどれだけ差があるのか徹底的に検証してみた
価格差4万円の「Google Pixel 8a」と「Google Pixel 8」はカメラ性能にどれだけ差があるのか徹底的に検証してみた
2024年5月14日(火)にリリースされる「Google Pixel 8a」はGoogle Pixel 8と比べて4万円以上安価ながら、同等の処理性能を備えています。「カメラ性能はどれだけ差があるのかな?」という疑問を解決するべく、両スマートフォンで色んな被写体を撮影しまくって性能の違いを検証してみました。
·gigazine.net·
価格差4万円の「Google Pixel 8a」と「Google Pixel 8」はカメラ性能にどれだけ差があるのか徹底的に検証してみた
OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能
OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能
OpenAIが日本時間の2024年5月14日(火)にAIモデル「GPT-4o」を発表しました。GPT-4oは単一のモデルでテキスト、音声、視覚入力を非常に高速に処理可能で、リアルタイムに会話しながら「計算問題を解く」「画像の生成」「周囲の映像から状況を判断」といったタスクを実行可能です。
·gigazine.net·
OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能
Googleが「動画で検索する機能」を発表するもデモ動画に致命的なミスが見つかる
Googleが「動画で検索する機能」を発表するもデモ動画に致命的なミスが見つかる
Googleが生成AIを用いた複数の検索機能を2024年5月15日(水)に開催された「Google I/O 2024」の基調講演で発表しました。この発表には「撮影した動画をもとに検索する機能」が含まれていたのですが、当該機能のデモ動画に致命的なミスが含まれていることが話題となっています。
·gigazine.net·
Googleが「動画で検索する機能」を発表するもデモ動画に致命的なミスが見つかる
Googleが映像と音声を理解して質問に答えるGPT-4oっぽいAIエージェント「Project Astra」を発表
Googleが映像と音声を理解して質問に答えるGPT-4oっぽいAIエージェント「Project Astra」を発表
Googleが現地時間の2024年5月14日に開催した開発者向けイベントの「Google I/O」で、映像や音声を理解してリアルタイムで質問に答えてくれるAIエージェント「Project Astra(Astra)」を発表しました。実際に、ユーザーがスマートフォンとスマートグラスのカメラで撮影した物事について、Astraにあれこれ質問しているデモ動画も公開されています。
·gigazine.net·
Googleが映像と音声を理解して質問に答えるGPT-4oっぽいAIエージェント「Project Astra」を発表
GoogleがAIによる「詐欺電話の検出」や「YouTubeの動画からの検索」機能を発表
GoogleがAIによる「詐欺電話の検出」や「YouTubeの動画からの検索」機能を発表
Googleが、2024年5月14日に開催した開発者カンファレンス「Google I/O 2024」で、AIモデルのGeminiとAndroidをより深く統合させることで、動画からの検索やPDFの要約、銀行員などを装って個人情報を要求する詐欺への警告などの機能がスマートフォンに搭載されることを発表しました。
·gigazine.net·
GoogleがAIによる「詐欺電話の検出」や「YouTubeの動画からの検索」機能を発表
Googleがオープンソースのビジュアル言語モデル「PaliGemma」を公開&Llama 3と同等性能の大規模言語モデル「Gemma 2」を発表
Googleがオープンソースのビジュアル言語モデル「PaliGemma」を公開&Llama 3と同等性能の大規模言語モデル「Gemma 2」を発表
Googleが2024年5月15日にビジュアル言語モデル(VLM)の「PaliGemma」と、大規模言語モデル(LLM)の「Gemma 2」を発表しました。PaliGemmaはすでにリリースされており、簡単に試せるデモも公開されています。
·gigazine.net·
Googleがオープンソースのビジュアル言語モデル「PaliGemma」を公開&Llama 3と同等性能の大規模言語モデル「Gemma 2」を発表
Googleフォトに「これまで訪れた国立公園の中で最高の写真を見せて」などの質問に答えてくれるAI機能「Ask Photos」が導入される
Googleフォトに「これまで訪れた国立公園の中で最高の写真を見せて」などの質問に答えてくれるAI機能「Ask Photos」が導入される
GoogleフォトにAIの「Gemini」が統合され、ユーザーが質問を投げかけるだけで過去に撮影した写真や動画を簡単に検索できるようになることが明らかになりました。
·gigazine.net·
Googleフォトに「これまで訪れた国立公園の中で最高の写真を見せて」などの質問に答えてくれるAI機能「Ask Photos」が導入される
GoogleがAI生成コンテンツに電子透かしを入れてフェイク拡散を防ぐ「SynthID」をテキストと動画にも拡張、一体どうやって文章に透かしを入れるのか?
GoogleがAI生成コンテンツに電子透かしを入れてフェイク拡散を防ぐ「SynthID」をテキストと動画にも拡張、一体どうやって文章に透かしを入れるのか?
GoogleのAI研究部門であるGoogle DeepMindが現地時間の2024年5月14日に、AI生成コンテンツにウォーターマーク(電子透かし)を入れてフェイク画像の拡散を防止するツール「SynthID」を、従来の画像だけでなくテキストと動画にも拡張することを発表しました。
·gigazine.net·
GoogleがAI生成コンテンツに電子透かしを入れてフェイク拡散を防ぐ「SynthID」をテキストと動画にも拡張、一体どうやって文章に透かしを入れるのか?
バグ・エラー・不具合を動画と画像とメタデータで再現可能にして開発者とサクッと簡単にブラウザの拡張機能で共有できる「Jam」レビュー
バグ・エラー・不具合を動画と画像とメタデータで再現可能にして開発者とサクッと簡単にブラウザの拡張機能で共有できる「Jam」レビュー
「Jam」はボタン一発でスクリーンショットや動画の撮影を行い、OSやブラウザのバージョンなどのメタデータと一緒にまとめて共有できる状態にしてくれるChrome・Edge・Arc・Brave・Operaなど各ブラウザ向けの拡張機能です。ユーザーからのバグ報告を受けるのに便利そうだったので実際に使い勝手を試してみました。
·gigazine.net·
バグ・エラー・不具合を動画と画像とメタデータで再現可能にして開発者とサクッと簡単にブラウザの拡張機能で共有できる「Jam」レビュー
GIMPで画像生成AIを使えるようにしてNPUでの処理も可能にするOpenVINOプラグイン「OpenVINO AI Plugins for GIMP」レビュー
GIMPで画像生成AIを使えるようにしてNPUでの処理も可能にするOpenVINOプラグイン「OpenVINO AI Plugins for GIMP」レビュー
Intel製CPU搭載を搭載したPCでGPUなしでもStable Diffusionを用いた画像生成を可能にするGIMP用プラグイン「OpenVINO AI Plugins for GIMP」がGitHubに公開されています。特徴的なのは、AIの演算処理に特化したプロセッサ「NPU」に対応しており、NPUを使った画像生成が可能だという点。ちょうどNPUを搭載したXPS 13とXPS 14をDellから借りていたので、導入から実際に使うところまでをまとめてみました。
·gigazine.net·
GIMPで画像生成AIを使えるようにしてNPUでの処理も可能にするOpenVINOプラグイン「OpenVINO AI Plugins for GIMP」レビュー
数枚の2D画像から3D空間を再現する「Toon3D」
数枚の2D画像から3D空間を再現する「Toon3D」
数枚の漫画・アニメの手描きの画像から「もっともらしい3D構造」を再現するツール「Toon3D」が公開されました。
·gigazine.net·
数枚の2D画像から3D空間を再現する「Toon3D」
MicrosoftがYouTubeなどの動画を吹き替えや字幕でリアルタイム翻訳するEdge向けの新AI機能を公開
MicrosoftがYouTubeなどの動画を吹き替えや字幕でリアルタイム翻訳するEdge向けの新AI機能を公開
現地時間の2024年5月20日、MicrosoftがウェブブラウザのMicrosoft Edge向けに、YouTubeなどのサイトに投稿された動画をAIを活用してリアルタイム翻訳し、吹き替えと字幕を提供する機能を発表しました。
·gigazine.net·
MicrosoftがYouTubeなどの動画を吹き替えや字幕でリアルタイム翻訳するEdge向けの新AI機能を公開
中国のスマホメーカー「HONOR」がGoogleのAIアシスタント「Gemini」や画像生成AI「Imagen 2」を自社製スマホで利用可能にする計画を発表
中国のスマホメーカー「HONOR」がGoogleのAIアシスタント「Gemini」や画像生成AI「Imagen 2」を自社製スマホで利用可能にする計画を発表
中国に拠点を置くデバイスメーカーのHONORが、自社製スマートフォンにGoogleのAI機能を統合することを2024年5月22日(水)に発表しました。加えて、HONORは自社製スマートフォンでAIアシスタント「Gemini」や画像生成AI「Imagen 2」を利用可能にする計画も明かしています。
·gigazine.net·
中国のスマホメーカー「HONOR」がGoogleのAIアシスタント「Gemini」や画像生成AI「Imagen 2」を自社製スマホで利用可能にする計画を発表
Windows 11の標準お絵描きアプリ「ペイント」の画像生成AI機能「Cocreator」にユーザーの描いたイラストを基にリアルタイムで画像生成する機能が発表される
Windows 11の標準お絵描きアプリ「ペイント」の画像生成AI機能「Cocreator」にユーザーの描いたイラストを基にリアルタイムで画像生成する機能が発表される
2023年11月にMicrosoftは、Windows 11の標準お絵描きアプリ「ペイント」に画像生成機能「Cocreator」を追加するアップデートを実施しました。さらにMicrosoftは2024年5月20日に、NPU搭載のPC「Copilot+ PC」向けに、Cocreatorでイラストを描きながらリアルタイムで画像を生成する機能を発表しました。
·gigazine.net·
Windows 11の標準お絵描きアプリ「ペイント」の画像生成AI機能「Cocreator」にユーザーの描いたイラストを基にリアルタイムで画像生成する機能が発表される
性的虐待につながるAI画像の生成・拡散・収益化を抑制するための自主的な取り組みをホワイトハウスが企業や連邦議会に呼びかけ
性的虐待につながるAI画像の生成・拡散・収益化を抑制するための自主的な取り組みをホワイトハウスが企業や連邦議会に呼びかけ
AIなどの技術を悪用した画像ベースの性的虐待が近年急増しており、特に女性や少女、LGBTQI+のコミュニティが標的となることが多く深刻な問題となっています。この問題に取り組むために、政府はテクノロジー企業や市民社会に協力を呼びかけ、画像ベースの性的虐待を防止・軽減するための自主的な取り組みを促しています。
·gigazine.net·
性的虐待につながるAI画像の生成・拡散・収益化を抑制するための自主的な取り組みをホワイトハウスが企業や連邦議会に呼びかけ
「アート投稿サービスのDeviantArtはAI作品とボットが宣伝と収益の仕組みを独占している」とアーティストから怒りの声
「アート投稿サービスのDeviantArtはAI作品とボットが宣伝と収益の仕組みを独占している」とアーティストから怒りの声
イラストなどのアート作品を投稿できる大手コミュニティサービス「DeviantArt」では、投稿されたイラストや3Dモデルなどを購入できる仕組みがあり、その販売数や作品への評価などに応じて、トップページに表示されたり公式SNSで宣伝されたりしてより多くのユーザーの目に付きやすくなります。しかし、この仕組みを悪用するボットが大量発生しており、DeviantArtはそれらに対応しようとしていないとアーティストから非難の声が上がっています。
·gigazine.net·
「アート投稿サービスのDeviantArtはAI作品とボットが宣伝と収益の仕組みを独占している」とアーティストから怒りの声
無料でGIFアニメをサイズやfpsを調整しながら作成できるオープンソースソフト「gifski」
無料でGIFアニメをサイズやfpsを調整しながら作成できるオープンソースソフト「gifski」
ムービーをGIFに変換できるソフト「gifski」は、PNG画像用のファイル圧縮アルゴリズムであるpngquantの機能を活用することで、ムービーの品質を可能な限り保ったハイクオリティなものから、ファイルサイズを抑えたものまで、目的に合わせてクオリティを調整したGIFアニメーションを作成することができます。無料でダウンロードできる&簡単操作で変換可能とのことなので、実際にGIFアニメーションを作成してみました。
·gigazine.net·
無料でGIFアニメをサイズやfpsを調整しながら作成できるオープンソースソフト「gifski」
プロ仕様なのに初心者でも使いやすい本格的なiPhone向け動画撮影アプリ「Kino」を使ってみたレビュー
プロ仕様なのに初心者でも使いやすい本格的なiPhone向け動画撮影アプリ「Kino」を使ってみたレビュー
iPhone向けにプロ仕様のカメラアプリを開発するHalideが、動画撮影アプリ「Kino」を2024年5月29日にリリースしました。細かい設定が可能でプロのニーズにも応える本格的な動画撮影ができ、なおかつ初心者でも簡単に操作できるのが売りとのことで、実際に「Kino」を使ってみました。
·gigazine.net·
プロ仕様なのに初心者でも使いやすい本格的なiPhone向け動画撮影アプリ「Kino」を使ってみたレビュー
AIは顔を見ただけで「保守派」「リベラル派」などの政治思想を特定できる可能性
AIは顔を見ただけで「保守派」「リベラル派」などの政治思想を特定できる可能性
「この人は保守派だ」「この人はリベラル政党を支持している」といった傾向を判断するには、通常はその人の言動などを分析する必要があります。しかし、スタンフォード大学経営大学院の研究チームが、顔認識技術とAIを組み合わせることで、顔を見るだけでその人の政治的指向を正確に評価できると主張しています。
·gigazine.net·
AIは顔を見ただけで「保守派」「リベラル派」などの政治思想を特定できる可能性
ストーリー性のあるマンガを自動生成するAIモデル「StoryDiffusion」
ストーリー性のあるマンガを自動生成するAIモデル「StoryDiffusion」
AIで生成した画像を使った漫画の著作権がアメリカで物議を醸したり、漫画の設定やあらすじを提案してくれるAIサービスが登場したりと、AIは絵やイラストの生成だけでなく漫画作品の制作にも活用されるようになってきています。中国のByteDanceと南開大学の研究チームが、ストーリーのある漫画を出力できるAIモデル「StoryDiffusion」を発表しました。
·gigazine.net·
ストーリー性のあるマンガを自動生成するAIモデル「StoryDiffusion」
Reolinkの4Kセキュリティカメラ「TrackMix PoE」と「RLC-833A」のできることの違いを比較してみた&Synology NASにつないでみた
Reolinkの4Kセキュリティカメラ「TrackMix PoE」と「RLC-833A」のできることの違いを比較してみた&Synology NASにつないでみた
4K・25FPSで撮影が可能でナイトビジョンで夜間の撮影もバッチリなReolinkのセキュリティカメラ「TrackMix PoE」と「RLC-833A」をゲットしたので、両者の比較およびSynologyのNASにつないでみる手順を確認してみました。
·gigazine.net·
Reolinkの4Kセキュリティカメラ「TrackMix PoE」と「RLC-833A」のできることの違いを比較してみた&Synology NASにつないでみた
無料でハイクオリティなCC0の3Dモデルやテクスチャをダウンロードしまくれる「ShareTextures」
無料でハイクオリティなCC0の3Dモデルやテクスチャをダウンロードしまくれる「ShareTextures」
写真家とアセットクリエイターによるサイト「ShareTextures」では、実際に撮影した写真やロイヤリティフリーの写真から作成した3Dモデルやテクスチャを配布しています。コンテンツはすべてCC0ライセンスのため、個人・商業問わず自由にダウンロードして活用することができます。
·gigazine.net·
無料でハイクオリティなCC0の3Dモデルやテクスチャをダウンロードしまくれる「ShareTextures」
あらゆる自動車を個別に追跡できる恐るべき公道監視カメラネットワークに対する批判
あらゆる自動車を個別に追跡できる恐るべき公道監視カメラネットワークに対する批判
アメリカのノースカロライナ州では、民間企業が提供する自動車のナンバープレートを読み取るカメラシステムを導入しています。このシステムは通過する全ての車両のナンバープレートや特徴をキャプチャし、犯罪に関連する車両だけでなく一般市民の車両のデータも収集することができ、州内外の法執行機関のみが捜査目的でアクセスできるようになっています。しかし、このカメラシステムについて、プライバシー擁護派からは厳しい批判の目が向けられています。
·gigazine.net·
あらゆる自動車を個別に追跡できる恐るべき公道監視カメラネットワークに対する批判
AI生成の外務省報道官「ヴィクトリア・シー」をウクライナが発表、まるで本物の人間のように話す紹介動画も公開中
AI生成の外務省報道官「ヴィクトリア・シー」をウクライナが発表、まるで本物の人間のように話す紹介動画も公開中
ウクライナ外務省は現地時間の2024年5月1日、外務省を代表してメディアに向けて公式声明を発信するAI報道官「Вікторія Ші(ヴィクトリア・シー)」を発表しました。報道にAI生成のデジタルパーソンを使用することにより、人間の外交官の時間を節約するのが狙いとのことです。
·gigazine.net·
AI生成の外務省報道官「ヴィクトリア・シー」をウクライナが発表、まるで本物の人間のように話す紹介動画も公開中