Found 2824 bookmarks
Newest
フルCG長編アニメの「トイ・ストーリー」はデジタルだけではなく35mmフィルムも駆使していた
フルCG長編アニメの「トイ・ストーリー」はデジタルだけではなく35mmフィルムも駆使していた
1995年に公開された『トイ・ストーリー』は、劇場用長編映画として世界で初めてフルCGアニメーションで制作されたアニメ映画です。この『トイ・ストーリー』は劇場公開版は35mmフィルムで上映され、のちに技術の進歩によってデジタル版がスタンダードとなりました。この2つのバージョンの違いについて、アニメ関連のニュースレターである「Animation Obsessive」が解説しています。
·gigazine.net·
フルCG長編アニメの「トイ・ストーリー」はデジタルだけではなく35mmフィルムも駆使していた
Googleの画像生成AI「Nano Banana」はなぜ優れているのか?
Googleの画像生成AI「Nano Banana」はなぜ優れているのか?
2025年3月末にChatGPTが無料での画像生成機能をサポートして以来、良くも悪くもChatGPTが画像生成AIにおけるベンチマークとなりました。しかし、Googleの画像生成AIである「Gemini 2.5 Flash Image(Nano Banana)」はChatGPTよりもはるかに優れているとして、その理由をデータサイエンティストのマックス・ウルフ氏が解説しています。
·gigazine.net·
Googleの画像生成AI「Nano Banana」はなぜ優れているのか?
デジタル画像にディザリングが必要な理由
デジタル画像にディザリングが必要な理由
デジタル画像には、画像の色数を削減したり異なる色で置き換えたりする際に使われる「ディザリング」という技法があります。ディザリングはどのようなもので、なぜ必要なのかについてデザインエンジニアのダン・ホリック氏が解説しています。
·gigazine.net·
デジタル画像にディザリングが必要な理由
OpenAI・Google・AnthropicのAIには「私はロボットではありません」のCAPTCHAを突破する能力に大きな差があることが判明
OpenAI・Google・AnthropicのAIには「私はロボットではありません」のCAPTCHAを突破する能力に大きな差があることが判明
インターネットで情報を収集していると、「私はロボットではありません」と記されたチェックボックスが出現し、面倒なクイズを出題されることがよくあります。このチェックボックスやクイズ問題は不正なボットを検出する「CAPTCHA」という仕組みなのですが、AIの発達によって人間の力を借りずともボット単体でCAPTCHAを突破できるようになりつつあります。ボット検出システムとAIの関係を調べているRoundtable Researchは、各種AIのCAPTCHA突破能力を調査し、その結果を公開しました。
·gigazine.net·
OpenAI・Google・AnthropicのAIには「私はロボットではありません」のCAPTCHAを突破する能力に大きな差があることが判明
1枚の写真から目的の人間や物体だけを切り抜いて3Dモデル化できるAI「SAM 3D Body」&「SAM 3D Objects」をMetaが公開
1枚の写真から目的の人間や物体だけを切り抜いて3Dモデル化できるAI「SAM 3D Body」&「SAM 3D Objects」をMetaが公開
Metaが画像から3Dモデルを生成できるAI「SAM 3D」を2025年11月19日(木)に発表しました。SAM 3Dは人体に特化した「SAM 3D Body」と物体に特化した「SAM 3D Objects」に分かれており、どちらも競合製品より高品質な3Dモデルを生成できます。
·gigazine.net·
1枚の写真から目的の人間や物体だけを切り抜いて3Dモデル化できるAI「SAM 3D Body」&「SAM 3D Objects」をMetaが公開
Metaが動画内の物体を識別して切り抜けるAIモデル「SAM 3」を発表
Metaが動画内の物体を識別して切り抜けるAIモデル「SAM 3」を発表
Metaがテキストや視覚的なサンプルをプロンプトとして使用し、画像やビデオ内のオブジェクトを検出、分割、追跡するための統合モデル「Meta Segment Anything Model 3(SAM 3)」を発表しました。
·gigazine.net·
Metaが動画内の物体を識別して切り抜けるAIモデル「SAM 3」を発表
Googleの画像生成AI「Gemini 3 Pro Image(Nano Banana Pro)」が登場、Geminiの推論機能を応用して言語対応や情報整理能力が強化
Googleの画像生成AI「Gemini 3 Pro Image(Nano Banana Pro)」が登場、Geminiの推論機能を応用して言語対応や情報整理能力が強化
Googleが画像生成AIのGemini 3 Pro Image(Nano Banana Pro)を2025年11月20日に発表しました。Gemini 3 Proをベースに構築されたNano Banana Proは、Gemini 2.5 Flash Image(Nano Banana)よりも優れた情報視覚化を実現しているとのことです。
·gigazine.net·
Googleの画像生成AI「Gemini 3 Pro Image(Nano Banana Pro)」が登場、Geminiの推論機能を応用して言語対応や情報整理能力が強化
「Gemini」アプリでGoogleのAI生成画像を見分けられるようになったそうなので実際にやってみた
「Gemini」アプリでGoogleのAI生成画像を見分けられるようになったそうなので実際にやってみた
2023年、Googleは目に見えない電子透かしを画像に埋め込む技術「SynthID」を開発し、それ以来GoogleのAIが生成するコンテンツに透かしを埋め込んできました。この電子透かしを新たにGeminiアプリで検知できるようになったと、Googleが発表しました。
·gigazine.net·
「Gemini」アプリでGoogleのAI生成画像を見分けられるようになったそうなので実際にやってみた
Googleの画像生成AI「Gemini 3 Pro Image(Nano Banana Pro)」は過去モデルや他社製モデルと比べてどれくらい優秀なのか?
Googleの画像生成AI「Gemini 3 Pro Image(Nano Banana Pro)」は過去モデルや他社製モデルと比べてどれくらい優秀なのか?
Googleが高品質な画像生成AI「Gemini 3 Pro Image(Nano Banana Pro)」を2025年11月20日にリリースしました。各種画像生成AIの画像編集能力を比較しているウェブサイト「GenAI Image Editing Showdown」にもNano Banana Proでのテスト結果が追加されており、旧モデルのNano Bananaや他社製モデルの結果を比較できるようになっています。
·gigazine.net·
Googleの画像生成AI「Gemini 3 Pro Image(Nano Banana Pro)」は過去モデルや他社製モデルと比べてどれくらい優秀なのか?
無料の画像背景除去AI「withoutbg」、オープンソースでセルフホスティングも可能
無料の画像背景除去AI「withoutbg」、オープンソースでセルフホスティングも可能
自分で撮影した画像を素材として使用する場合、背景の消去は必須の処理となります。しかし、手作業で背景を切り抜く作業は非常に手間がかかるので、AIによる自動処理はほぼ必須といえます。ただ、高額な画像処理ツールの一機能であることが多く、ちょっと試しに使ってみたい程度の感覚で利用するには敷居が高いといえます。無料で利用可能な背景除去ツールをうたうウェブサービスもありますが、処理の甘さが目立つなどといった限界を感じる場合が多いです。そんな中、Githubで公開されており、高性能かつセルフホスティング可能な画像背景除去AIが「withoutbg」です。
·gigazine.net·
無料の画像背景除去AI「withoutbg」、オープンソースでセルフホスティングも可能
無料でオープンソースの動画編集アプリ「Kdenlive」レビュー、Windows・macOS・Linuxで動作可能
無料でオープンソースの動画編集アプリ「Kdenlive」レビュー、Windows・macOS・Linuxで動作可能
「Kdenlive」は無料で使えるオープンソースのノンリニア動画編集ソフトウェアです。動画のカットやエフェクト、字幕の追加、色編集などが可能で、Windows・Linux・macOSで利用できます。
·gigazine.net·
無料でオープンソースの動画編集アプリ「Kdenlive」レビュー、Windows・macOS・Linuxで動作可能
ついに画像生成AI「FLUX.2」が登場、家のPCでローカル実行可能
ついに画像生成AI「FLUX.2」が登場、家のPCでローカル実行可能
ドイツのAIスタートアップであるBlack Forest Labsが、画像生成AIモデルファミリー「FLUX.2」を2025年11月25日にリリースしました。これは以前のモデルであるFLUX.1の成功を受け、さらに機能を拡張したもので、デモや遊びだけでなく実用的なクリエイティブワークフローでの利用を想定して設計されています。
·gigazine.net·
ついに画像生成AI「FLUX.2」が登場、家のPCでローカル実行可能
高速かつ高品質な画像生成AI「Z-Image」をAlibabaが公開
高速かつ高品質な画像生成AI「Z-Image」をAlibabaが公開
Alibaba所属の研究者が、リアリティのある画像の生成に優れたモデル「Z-Image(造相)」を開発しました。Z-Imageのパラメータ数は60億で、短時間で高品質な画像を生成できることを特徴としています。
·gigazine.net·
高速かつ高品質な画像生成AI「Z-Image」をAlibabaが公開
Alibabaの視覚言語AIモデル「Qwen3-VL」は2時間ある映像に挿入されたフレームを99.5%の精度で特定可能
Alibabaの視覚言語AIモデル「Qwen3-VL」は2時間ある映像に挿入されたフレームを99.5%の精度で特定可能
中国のIT大手・Alibaba(阿里巴巴:アリババ)が、AIモデル「Qwen」シリーズで最も高性能な視覚言語モデルである「Qwen3-VL」の技術レポートを公開しました。様々なベンチマークを行った結果、Qwen3-VLは「視覚的な数学タスク」を得意とするほか、言語網羅率もQwen2.5のほぼ4倍の39言語に増加し、そのうち32の言語でOCR精度が70%超えとなっていることが報告されています。
·gigazine.net·
Alibabaの視覚言語AIモデル「Qwen3-VL」は2時間ある映像に挿入されたフレームを99.5%の精度で特定可能
動画が本物かAI生成かを見分けるテスト、専門家によるAI生成動画を見分けるためのアドバイスとは?
動画が本物かAI生成かを見分けるテスト、専門家によるAI生成動画を見分けるためのアドバイスとは?
AIの発達につれてAIが生成する動画のクオリティも大きく上がっており、本物の映像ではないと見分けることが難しいケースもあります。アメリカの公共放送であるNPRが、ブラウザから無料でチャレンジできる「動画を見て本物かAIか当てるクイズ」を公開しています。クイズに挑戦した後は、専門家によるAIを見分けるアドバイスも参照できます。
·gigazine.net·
動画が本物かAI生成かを見分けるテスト、専門家によるAI生成動画を見分けるためのアドバイスとは?
画像生成AIで作った微妙なドット絵風画像をゲームで使える形式に直すウェブアプリ「Unfaker」
画像生成AIで作った微妙なドット絵風画像をゲームで使える形式に直すウェブアプリ「Unfaker」
画像生成AIを使うと簡単にドット絵風の画像を作れますが、高品質な画像生成AIであっても「色がにじむ」「線が曲がる」「完全な格子状にならない」といった問題が発生します。そんな問題を解決するべく開発されたJavaScriptライブラリが「unfake.js」で、ドット絵風画像の各種問題をサクッと解決してゲーム開発などに使える形式に変換できます。
·gigazine.net·
画像生成AIで作った微妙なドット絵風画像をゲームで使える形式に直すウェブアプリ「Unfaker」
動画生成AI「Runway Gen-4.5」が登場、OpenAIのSora 2やGoogleのVeo 3より高性能
動画生成AI「Runway Gen-4.5」が登場、OpenAIのSora 2やGoogleのVeo 3より高性能
AI開発企業のRunwayが動画生成AI「Runway Gen-4.5」を2025年12月1日に発表しました。Runway Gen-4.5はプロンプト追従性や物理現象の再現性能が向上しており、GoogleのVeo 3やOpenAIの Sora 2を上回る性能を示しています。
·gigazine.net·
動画生成AI「Runway Gen-4.5」が登場、OpenAIのSora 2やGoogleのVeo 3より高性能
Amazonがプライム・ビデオでAI要約動画を導入も滅茶苦茶なナレーションを生成してしまい急遽撤去
Amazonがプライム・ビデオでAI要約動画を導入も滅茶苦茶なナレーションを生成してしまい急遽撤去
Amazonがプライム・ビデオでシリーズ作品の振り返り動画などを生成できる「Video Recaps」という機能を導入しました。しかし、このVideo Recapsが生成する動画には間違った内容が含まれることが明らかになり、Amazonは同機能を一時的に撤去する事態に陥っています。
·gigazine.net·
Amazonがプライム・ビデオでAI要約動画を導入も滅茶苦茶なナレーションを生成してしまい急遽撤去
「ロボットがトマトの収穫成功率を予測するモデル」を日本の研究者が構築
「ロボットがトマトの収穫成功率を予測するモデル」を日本の研究者が構築
農業分野における労働力不足が深刻化する中でロボットの活用が注目される中で、大阪公立大学大学院工学研究科の藤永拓矢助教が、「ロボットがトマトの収穫成功率を予測するモデル」を構築しました。
·gigazine.net·
「ロボットがトマトの収穫成功率を予測するモデル」を日本の研究者が構築
世界中の27億5000万軒の建物3Dデータを網羅したデータセット「GlobalBuildingAtlas」と3D地図が公開される
世界中の27億5000万軒の建物3Dデータを網羅したデータセット「GlobalBuildingAtlas」と3D地図が公開される
ミュンヘン工科大学が世界中のすべての建物を網羅した高解像度3Dデータセット「GlobalBuildingAtlas」を公開しました。GlobalBuildingAtlasは都市開発や防災などに役立つとされており、データセットを活用した3D地図も公開されています。
·gigazine.net·
世界中の27億5000万軒の建物3Dデータを網羅したデータセット「GlobalBuildingAtlas」と3D地図が公開される
ディズニーとOpenAIのライセンス契約は1年間のみ独占契約なので1年後には他のAI企業も契約可能
ディズニーとOpenAIのライセンス契約は1年間のみ独占契約なので1年後には他のAI企業も契約可能
ディズニーはOpenAIとライセンス契約を結び、ディズニーキャラクターを動画生成AIのSoraで描写できるようにしました。このライセンス契約の期間は3年間ではあるものの、独占期間は1年のみなので、それ以降は他のAI企業と同様の契約を結ぶことが可能であることが明らかになっています。
·gigazine.net·
ディズニーとOpenAIのライセンス契約は1年間のみ独占契約なので1年後には他のAI企業も契約可能
Appleが1枚の画像を3Dシーンに変換できる手法「SHARP」を発表、標準的なGPUで1秒未満で処理可能
Appleが1枚の画像を3Dシーンに変換できる手法「SHARP」を発表、標準的なGPUで1秒未満で処理可能
Appleが、たった1枚の画像から高精度な3Dシーンを生成する手法「SHARP」を発表しました。SHARPはニューラルネットワークを利用し、標準的なGPUでも1秒未満で実行可能とのことです。
·gigazine.net·
Appleが1枚の画像を3Dシーンに変換できる手法「SHARP」を発表、標準的なGPUで1秒未満で処理可能
OpenAIが画像生成モデル「GPT Image 1.5」を搭載した「ChatGPT Images」を公開、画像生成が最大4倍高速化でGoogleのNano Banana Proに対抗
OpenAIが画像生成モデル「GPT Image 1.5」を搭載した「ChatGPT Images」を公開、画像生成が最大4倍高速化でGoogleのNano Banana Proに対抗
OpenAIは2025年12月17日に、新しい画像生成モデル「GPT Image 1.5」を搭載した新バージョンの「ChatGPT Images」をリリースしました。この新モデルは、ゼロからの画像生成だけでなく、既存の写真の編集においてもユーザーの意図をより確実に反映できるよう設計されています。
·gigazine.net·
OpenAIが画像生成モデル「GPT Image 1.5」を搭載した「ChatGPT Images」を公開、画像生成が最大4倍高速化でGoogleのNano Banana Proに対抗
いろんな音が混ざった動画や音声から目的の音だけを分離できるAI「SAM Audio」をMetaが公開
いろんな音が混ざった動画や音声から目的の音だけを分離できるAI「SAM Audio」をMetaが公開
Metaが音声分離AI「SAM Audio」を公開しました。SAM Audioには音声や動画を入力可能で、「文章で指示して特定の音を抜き出す」「動画内の『音声を発している被写体』を指定して音声を抜き出す」「動画内の特定のタイミングで鳴っている音を指定して抜き出す」といった操作が可能です。
·gigazine.net·
いろんな音が混ざった動画や音声から目的の音だけを分離できるAI「SAM Audio」をMetaが公開