Search Outils et applications

Found 3 bookmarks

Newest

kyutai-labs/moshi: Moshi is a speech-text foundation model and full-duplex spoken dialogue framework. It uses Mimi, a state-of-the-art streaming neural audio codec.

kyutai-labs/moshi: Moshi is a speech-text foundation model and full-duplex spoken dialogue framework. It uses Mimi, a state-of-the-art streaming neural audio codec.

Moshi is a speech-text foundation model and full-duplex spoken dialogue framework. It uses Mimi, a state-of-the-art streaming neural audio codec. - kyutai-labs/moshi

AI #AI #Audio #Chatbot #Open Source #S2TXT

·github.com·yesterday at 8:38 PM

kyutai-labs/moshi: Moshi is a speech-text foundation model and full-duplex spoken dialogue framework. It uses Mimi, a state-of-the-art streaming neural audio codec.

SpeechBrain: Open-Source Conversational AI for Everyone

SpeechBrain: Open-Source Conversational AI for Everyone

AI #Open Source #Chatbot #AI #Audio

·speechbrain.github.io·Oct 16, 2024

SpeechBrain: Open-Source Conversational AI for Everyone

pipecat-ai/pipecat: Open Source framework for voice and multimodal conversational AI

pipecat-ai/pipecat: Open Source framework for voice and multimodal conversational AI

Open Source framework for voice and multimodal conversational AI - pipecat-ai/pipecat

Chatbot

Chatbot #AI #Chatbot #Audio #Open Source

·github.com·Aug 24, 2024

pipecat-ai/pipecat: Open Source framework for voice and multimodal conversational AI