Hlasová syntéza čísel

HackForum

Hlasová syntéza čísel#
Takže, jedná se opět o jednoduchý program, který generuje hlasovou reprezentaci čísel z namluvených vzorků řeči pomocí konkatenační syntézy.

Samotný program umožní tyto generované zvuky přehrávat pomocí WinAPI funkcí.

Data pro syntézu jsou uložena ve dvou souborech. Jeden obsahuje indexy vzorků na začátek a na konec slova. Druhý obsahuje samotný zvukový signál.

Data jsou uložena ve formátu RAW PCM, mono, 16-bit, signed, little endian (S16_LE). Vzorkovací frekvence == 8000 Hz. Jako popis to myslím stačí.

Zdrojové kódy: [link]

Datové soubory: [link]

Binárka: [link]
(odpovědět)
_( | )_ | 85.132.197.*13.4.2008 13:39
re: Hlasová syntéza čísel#
jak dlouho ti to trvalo než jsi to udělal ?
(odpovědět)
MiKee | 90.176.215.*13.4.2008 13:41
re: Hlasová syntéza čísel#
Par hodin. Kod jsem mel napsany za 2 hodky, pak jsem to jen doladil. nic na tom neni
(odpovědět)
_( | )_ | 85.132.197.*13.4.2008 13:48
re: Hlasová syntéza čísel#
(_|_) : moc pekne, ale ma to par bugu, je to asi proto ze jsi "to mel za dve hodinky".. :P <noflame>

Napriklad :
572 -> "sedmdesat sedm"
540 -> "ctyricet pet"
999 -> "devet"
321 -> "dvacet ctyri"
680 -> "osmdesat sest"

atd.. vypada to jak kdyby cisla nad 100 byly cteny random :D.. Zatim jsem neprisel v cem je problem :/
kompiloval jsem to v MinGW32 (Dev-c++) ale to by nemel byt imo ten problem :X

(odpovědět)
czYbph0 | 213.84.233.136/192.168.8.*13.4.2008 19:49
re: Hlasová syntéza čísel#
Ja sem to testoval na vsechny cisla z toho rozmezi a zadnej bug tam nebyl... (teda je to ta jeho binarka)
(odpovědět)
babca | 194.212.59.*13.4.2008 20:14
re: Hlasová syntéza čísel#
No je to hezky :) a ani to neni tak slozity... btw jsem delal neco podnyho na prevadeni textu na morzeovu abecedu. Pekne :).
(odpovědět)
babca | 194.212.59.*13.4.2008 14:24
re: Hlasová syntéza čísel#
3, 2, 1, FLAME, jinak good job ;)

----------
..:@]> [link] <[@:..
(odpovědět)
DjH | E-mail | Website | ICQ 319-960-89513.4.2008 14:32
re: Hlasová syntéza čísel#
aha, jak tak na ten zdrojak koukam, tak konkatenacni synteza je presne to, co jsem z nazvu vytusil :) zajimave :)

(odpovědět)
prc | 213.211.51.*13.4.2008 19:45
re: Hlasová syntéza čísel#
Příště upni prosímtě zdrojáky na openpaste.org (či na jiné paste...)...
(odpovědět)
C X | 82.113.53.*13.4.2008 20:49
re: Hlasová syntéza čísel#
Takovych projektu "programovani picovin" bych udelal vice. Clovek si tak krasne procvici psani kodu a obnovi si v pameti veci, ktere vadnou ;)
Jenze na nejaky vetsi projekt tu asi nikdo schopnejsi nebude a delat to sam... nemam tolik casu. Mam na mysli VELKE projekty. Samozrejme C/C++ , databaze vseho druhu (MySQL, Firebird, Oracle, etc..) i Assembler x86 a x86_64. Mam v planu postavit si radar, ktery by byl pripojeny k pocitaci, na kterem by bylo patricne GUI a v podstate udelany cely system. Zatim potrebuju tak mesic, nez nastuduju neco z elektroniky ;)

Radar by mel umet toto: Zobrazovat vse, co je v okoli, tzn. auta, baraky, letadla, atd.... dosah cca 3 km. Na monitoru by se toto zobrazovalo z ptaci perspektivy, takze barak by byl ctverecek, panelak obdelnik, atd.... Ale vypracovat takovy system je uz velke sousto i na me. Takze by bodli tak 2 schopni koderi C++, co by zvladli plnit nejaky plan. Jako zmakl bych to i sam, ale je to tak na rok :D

Co se tyce financovani, tak to pujde z moji kapsy.
(odpovědět)
_( | )_ | 85.132.197.*13.4.2008 21:58
re: Hlasová syntéza čísel#
To co zde popisuješ se mi zdá jako pro amatéra technicky nerealizovatelné. Tebou popsané zařízení by totiž muselo být:
a) ve vzduchu, aspoň několik set metrů
b) postavené s použitím poměrně pokročilé technologie

Radiové vlny použité v radaru se totiž odrážejí, což by ti znemožnilo zobrazovat domy jako čtverečky z pohledu ptačí perspektivy, když by radar stál na zemi. Navíc, materiály ze kterých jsou domy vyrobené mají různé vlastnosti - jedny by se tvářili jako že tam nic není (to když by byl signál pohlcen), druhé by pro změnu zase házeli spoustu odrazů, které by se odráželi od dalších a dalších věcí, čímž by vznikal pěkný guláš. Další věc je pásmo a výkon. Musel by jsi si najít nějaké nelicencované pásmo a nesměl by jsi překročit určitý výkon. Navíc se bojím, že by se špatně shánělo(vyrábělo?) zařízení pro přijímání a vysílání signálu. Musí být totiž poměrně výkoné (záleží zase jak se to vezme) a citlivé. Dále je zde to, že nesmí rušit samo sebe.

Mno, tohle mě napadlo jenom tak, když jsem nad tím zběžně popřemýšlel. Je možné že už tě to taky napadlo, v tom případě by mě dost zajmalo, jak jsi dané problémy alespoň teoreticky vyřešil. Jinak to zní opravdu zajmavě, hodilo by se nějaké podrobnější info.
(odpovědět)
Bystroushaak | E-mail | Website | PGP14.4.2008 18:34
re: Hlasová syntéza čísel#
ja taky nevim jak to budu delat.... musim obvolat me stare IT zname co delaji u armady a poradit se, ziskat material, atd... S programovanim neni problem.

Samozrejme, ze nepojedu podle prirucky z phreaking.soom.cz nebo dokonce podle nejakeho clanku ze subber.php5.cz , kde by mi ten dynamit urval ruce ;)
(odpovědět)
_( | )_ | 85.132.197.*14.4.2008 19:58
re: Hlasová syntéza čísel#
btw, neco podobnyho jsem delal s lego nxt (pomoci ultrasonicu) ten se otacel a mapoval teren (meril vzdalenosti objektu cca asi po 15°) data ukladal do souboru a po otocce (360°) pomoci bt odeslal tyto data do ntb ten pomoci udaju udelal graf :), bohzel dosah byl asi jen do 2 m :(). Byla to picovina, ale u ucitelu to melo uspech :D
(odpovědět)
babca | 194.212.59.*13.4.2008 22:38

Zpět
Svou ideální brigádu na léto najdete na webu Ideální brigáda
 
 
 

 
BBCode