Ca y est !!! record.py
permet de lancer un enregistrement audio et de le convertir en texte.
Le code se trouve ici : GitHub - papiche/raspberry_ninja: Publish or capture VDO.Ninja streams with Python (Raspberry Pi, Linux, Mac, Windows WSL)
En démo sur https://vdo.copylaradio.com
Saisir un nom de ROOM et un Identifiant à votre enregistrement
Pour joindre la session, pas besoin de caméra, juste de capturer « audio interne »
Ensuite, y’a plus qu’à causer, ça écoute…
A la fin, fermer la « room » et récupérez la transcription texte
on peut indiquer la langue, ou avoir une traduction.
- Et récupérer « Ce qui s’est dit sur un ID» : https://vdo.copylaradio.com/stt?id=10110
Évolutions…
On utilise le modèle « small » de openai-whisper, il faudrait essayer faster-whisper, et combiner plusieurs agents LLM…
On peut faire évoluer un modèle pour le personnaliser selon un fil de données… Les résultats sont bluffants, et les possibilités immenses.
Le fait d’avoir un portefeuille G1 sur la machine permet de commander ses traitements IA en envoyant la commande avec les June…
Un avantage dans ce monde du calcul distribué
Convertissez vos Visio en texte
VDO.spider