Diskussions- und Newsboard der Linux Interessen Gruppe Suletuxe
allgemeine Kategorie => Fragen zu Linux-Anwendungen => Thema von: Sebastian am 29. November 2024, 13:10:44

Titel: TTS Stimme Thorsten-Voice
Beitrag von: Sebastian am 29. November 2024, 13:10:44

Hallo Suletuxe,

Ich möchte euch hier wieder einmal an meinen Erfahrungen teilhaben lassen.

Und zwar habe ich das Projekt https://www.thorsten-voice.de/ gefunden.
Zitat:
Eine qualitativ hochwertige (AI/KI), deutsche, künstliche TTS/Text-to-Speech Stimme, die offline erzeugt werden kann, sollte jedem Projekt kostenlos und ohne lizenzrechtliche Einschränkungen (Open Source) zur Verfügung stehen.


Da dachte ich mir cool, endlich eine gescheite Deutsche Stimme die man verwenden kann um Text in Sprache umzuwandeln. Um z.b. YouTube-Videos zu vertonen oder andere Dinge damit anzustellen.

Also wollte ich nach dem Installations Video das Thorsten Müller selbst gedreht hat eine Installation wagen:

[youtube uyG1Sx7_3Yg]

Bei der Installation stellte ich dann fest das das eingesetzte Programm für seine Stimme

https://github.com/coqui-ai/TTS

eine ältere Python Version erfoderte als ich auf meinen Arch System habe. Erster gedanke war also ein podman Container aufzusetzten. Und das Programm mit seinen benötigten Abhähigkeiten dortdrin laufen lassen.

podman eignet sich hier für hervorragend gegenüber zu docker. Da ich für diese Anwendung keinen Container mit Root Rechten benötige. Flux podman installiert und eine Anpassung an der /etc/subuid und /etc/subgid vorgenommen, da meine Arch Installation schon älter ist.

https://wiki.archlinux.org/title/Podman#Migration_for_users_created_prior_to_shadow_4.11.1-3

Dann das Image gepullt:


Code:

podman pull ghcr.io/coqui-ai/tts-cpu


ein neues Verzeichnis für die wav Dateien erstellt:


Code:

mkdir ~/tts


Und mit


Code:

podman run --rm -v ~/tts:/root/tts-output ghcr.io/coqui-ai/tts-cpu:latest --model_name tts_models/de/thorsten/tacotron2-DDC --out_path /root/tts-output/test1.wav --text "Das ist ein Test."


Ausprobiert ob es funktioniert. Und tada ich hatte eine Synthetisierte wav Datei mit dem Gesprochen den Text im Verzeichnis liegen.

Jetzt muss ich nur noch lernen wie ich das docker Image umbaue damit bei der Erzeugung eines neuen Containers gleich die TTS Stimme mit eingebaut wird. Damit nicht jedesmal wenn ich einen neuen Container erzeuge erst wieder die Stimme heruntergeladen werden muss.

Als Vorlage werde ich die

https://github.com/coqui-ai/TTS/blob/dev/dockerfiles/Dockerfile.dev

Verwenden und mir dann ein eigenes Image basteln.

Anmerkung:

Die Einrichtung und Verwendung des Containers fand alles ohne Root rechte in meinen home Verzeichnis statt. Das ist der Hauptvorteil gegenüber von Docker das podman Cointainer ohne Root Rechte verwalten kann. Und weniger Resourcen benötigt weil der Docker Deamon überflüssig bei podman ist. Die Container werden mithilfe von cgroups vom Kernel Nativ erstellt und mithilfe von podman als warpper für systemd gemanaged.

LG
Sebastian

Titel: Re:TTS Stimme Thorsten-Voice
Beitrag von: Andreas am 29. November 2024, 14:26:16

Ich hatte früher auch schon mal mit deutschen Sprachausgaben experimentiert, war aber damit nicht wirklich zufrieden. Das hier hört sich sehr interessant an. Eine Idee, wie Du die Virtualisiserung überflüssig machst wäre, den Python-Code auf Python 3.12 anzupassen - idealerweise als Pull Request an das Github. Die Änderungen zwischen 3.11 und 3.12 sind überschaubar und auch für Leute, die Python nicht wirklich können, einzupflegen, denke ich. Zusätzlich kann es nicht schaden, auch mal einen Blick auf Python Code zu werfen. Python ist eine sehr schöne Sprache und es lohnt sich, sie zu lernen...

LG
Andreas

Titel: Re:TTS Stimme Thorsten-Voice
Beitrag von: Sebastian am 29. November 2024, 17:46:17

Synthetisiert aus meinen Angepassten Docker/podman Image. ;D

Titel: Re:TTS Stimme Thorsten-Voice
Beitrag von: Andreas am 30. November 2024, 07:54:05

Das ist wirklich schon krass gut für eine offline-Ausgabe!

Wir sehen uns heute Abend

LG
Andreas

Titel: Re:TTS Stimme Thorsten-Voice
Beitrag von: Sebastian am 30. November 2024, 08:21:18

Jetzt wollte ich mir den Python Code mal anschauen im Repository

https://github.com/coqui-ai/TTS

Und musste feststellen das dies nicht mehr geflegt wird. Und die Community davon schon einen fork gemacht hat wo dies weiteretwicklet wird.

https://github.com/idiap/coqui-ai-TTS

Von dem Fork das pip Paket funktioniert auch schon mit python 3.12 das Paket nennt sich jetzt coqui-tts

Wir sehen uns heute Abend

LG
Sebastian


Diskussions- und Newsboard der Linux Interessen Gruppe Suletuxe | Powered by YaBB SE
© 2001-2003, YaBB SE Dev Team. All Rights Reserved.