logo

Suletuxe.de
Linux - Nutzer
helfen
Linux - Nutzern

Willkommen, Gast. Bitte Login oder Registrieren.
05. Februar 2025, 06:53:19
Übersicht Hilfe Suche Login Registrieren

Amateurfunk Sulingen
Diskussions- und Newsboard der Linux Interessen Gruppe Suletuxe  |  allgemeine Kategorie  |  Fragen zu Linux-Anwendungen  |  Thema: TTS Stimme Thorsten-Voice « zurück vorwärts »
Seiten: [1] nach unten Drucken
   Autor  Thema: TTS Stimme Thorsten-Voice  (Gelesen 403 mal)
Sebastian
YaBB God
*****

Offline

Einträge: 584





Profil anzeigen
TTS Stimme Thorsten-Voice
« am: 29. November 2024, 13:10:44 »

Hallo Suletuxe,

Ich möchte euch hier wieder einmal an meinen Erfahrungen teilhaben lassen.

Und zwar habe ich das Projekt https://www.thorsten-voice.de/ gefunden.

Zitat:
Eine qualitativ hochwertige (AI/KI), deutsche, künstliche TTS/Text-to-Speech Stimme, die offline erzeugt werden kann, sollte jedem Projekt kostenlos und ohne lizenzrechtliche Einschränkungen (Open Source) zur Verfügung stehen.

Da dachte ich mir cool, endlich eine gescheite Deutsche Stimme die man verwenden kann um Text in Sprache umzuwandeln. Um z.b. YouTube-Videos zu vertonen oder andere Dinge damit anzustellen.

Also wollte ich nach dem Installations Video das Thorsten Müller selbst gedreht hat eine Installation wagen:





Bei der Installation stellte ich dann fest das das eingesetzte Programm für seine Stimme

https://github.com/coqui-ai/TTS

eine ältere Python Version erfoderte als ich auf meinen Arch System habe. Erster gedanke war also ein podman Container aufzusetzten. Und das Programm mit seinen benötigten Abhähigkeiten dortdrin laufen lassen.

podman eignet sich hier für hervorragend gegenüber zu docker. Da ich für diese Anwendung keinen Container mit Root Rechten benötige. Flux podman installiert und eine Anpassung an der /etc/subuid und /etc/subgid vorgenommen, da meine Arch Installation schon älter ist.

https://wiki.archlinux.org/title/Podman#Migration_for_users_created_prior_to_shadow_4.11.1-3

Dann das Image gepullt:

Code:

podman pull ghcr.io/coqui-ai/tts-cpu


ein neues Verzeichnis für die wav Dateien erstellt:

Code:

mkdir ~/tts


Und mit

Code:

podman run --rm -v ~/tts:/root/tts-output ghcr.io/coqui-ai/tts-cpu:latest --model_name tts_models/de/thorsten/tacotron2-DDC --out_path /root/tts-output/test1.wav --text "Das ist ein Test."

Ausprobiert ob es funktioniert. Und tada ich hatte eine Synthetisierte wav Datei mit dem Gesprochen den Text im Verzeichnis liegen.

Jetzt muss ich nur noch lernen wie ich das docker Image umbaue damit bei der Erzeugung eines neuen Containers gleich die TTS Stimme mit eingebaut wird. Damit nicht jedesmal wenn ich einen neuen Container erzeuge erst wieder die Stimme heruntergeladen werden muss.

Als Vorlage werde ich die

https://github.com/coqui-ai/TTS/blob/dev/dockerfiles/Dockerfile.dev

Verwenden und mir dann ein eigenes Image basteln.

Anmerkung:

Die Einrichtung und Verwendung des Containers fand alles ohne Root rechte in meinen home Verzeichnis statt. Das ist der Hauptvorteil gegenüber von Docker das podman Cointainer ohne Root Rechte verwalten kann. Und weniger Resourcen benötigt weil der Docker Deamon überflüssig bei podman ist. Die Container werden mithilfe von cgroups vom Kernel Nativ erstellt und mithilfe von podman als warpper für systemd gemanaged.

LG
Sebastian
Gespeichert

Richtig um Hilfe bitten
Andreas
Administrator
*****

Offline

Einträge: 1408



Linux von Innen

Profil anzeigen
Re:TTS Stimme Thorsten-Voice
« Antwort #1 am: 29. November 2024, 14:26:16 »

Ich hatte früher auch schon mal mit deutschen Sprachausgaben experimentiert, war aber damit nicht wirklich zufrieden. Das hier hört sich sehr interessant an. Eine Idee, wie Du die Virtualisiserung überflüssig machst wäre, den Python-Code auf Python 3.12 anzupassen - idealerweise als Pull Request an das Github. Die Änderungen zwischen 3.11 und 3.12 sind überschaubar und auch für Leute, die Python nicht wirklich können, einzupflegen, denke ich. Zusätzlich kann es nicht schaden, auch mal einen Blick auf Python Code zu werfen. Python ist eine sehr schöne Sprache und es lohnt sich, sie zu lernen...

LG
Andreas
Gespeichert

Wissen ist das einzige Gut, das mehr wird, wenn man es teilt - wenn es Menschen gibt, die es teilen, und es Menschen gibt, die bereit sind, dieses Geschenk auch mit eigenem Einsatz anzunehmen.


Freiheit zu erkämpfen reicht nicht. Man muss sie auch verteidigen.


Ohne IT-Kompetenz ist man heutzutage ein willkommenes Opfer und Spielball anderer, egal, welches System oder Gerät man nutzt. Nur Wissen schützt vor Schaden!
Sebastian
YaBB God
*****

Offline

Einträge: 584





Profil anzeigen
Re:TTS Stimme Thorsten-Voice
« Antwort #2 am: 29. November 2024, 17:46:17 »

Synthetisiert aus meinen Angepassten Docker/podman Image. 
 voice.mkv
Gespeichert

Richtig um Hilfe bitten
Andreas
Administrator
*****

Offline

Einträge: 1408



Linux von Innen

Profil anzeigen
Re:TTS Stimme Thorsten-Voice
« Antwort #3 am: 30. November 2024, 07:54:05 »

Das ist wirklich schon krass gut für eine offline-Ausgabe!

Wir sehen uns heute Abend

LG
Andreas
Gespeichert

Wissen ist das einzige Gut, das mehr wird, wenn man es teilt - wenn es Menschen gibt, die es teilen, und es Menschen gibt, die bereit sind, dieses Geschenk auch mit eigenem Einsatz anzunehmen.


Freiheit zu erkämpfen reicht nicht. Man muss sie auch verteidigen.


Ohne IT-Kompetenz ist man heutzutage ein willkommenes Opfer und Spielball anderer, egal, welches System oder Gerät man nutzt. Nur Wissen schützt vor Schaden!
Sebastian
YaBB God
*****

Offline

Einträge: 584





Profil anzeigen
Re:TTS Stimme Thorsten-Voice
« Antwort #4 am: 30. November 2024, 08:21:18 »

Jetzt wollte ich mir den Python Code mal anschauen im Repository

https://github.com/coqui-ai/TTS

Und musste feststellen das dies nicht mehr geflegt wird. Und die Community davon schon einen fork gemacht hat wo dies weiteretwicklet wird.

https://github.com/idiap/coqui-ai-TTS

Von dem Fork das pip Paket funktioniert auch schon mit python 3.12 das Paket nennt sich jetzt coqui-tts

Wir sehen uns heute Abend

LG
Sebastian
Gespeichert

Richtig um Hilfe bitten
Seiten: [1] nach oben Drucken 
Diskussions- und Newsboard der Linux Interessen Gruppe Suletuxe  |  allgemeine Kategorie  |  Fragen zu Linux-Anwendungen  |  Thema: TTS Stimme Thorsten-Voice « zurück vorwärts »
Gehe zu: 


Login mit Username, Passwort und Session Länge

 Es wird die Verwendung "Blink"-basierter Browser und mindestens 1024x768 Pixel Bildschirmauflösung
für die beste Darstellung empfohlen
 
freie Software für freie Menschen!
Powered by MySQL Powered by PHP Diskussions- und Newsboard der Linux Interessen Gruppe Suletuxe | Powered by YaBB SE
© 2001-2004, YaBB SE Dev Team. All Rights Reserved.
- modified by Andreas Richter (DF8OE)
Valid XHTML 1.0! Valid CSS!