| Takže, jedná se opět o jednoduchý program, který generuje hlasovou reprezentaci čísel z namluvených vzorků řeči pomocí konkatenační syntézy.
Samotný program umožní tyto generované zvuky přehrávat pomocí WinAPI funkcí.
Data pro syntézu jsou uložena ve dvou souborech. Jeden obsahuje indexy vzorků na začátek a na konec slova. Druhý obsahuje samotný zvukový signál.
Data jsou uložena ve formátu RAW PCM, mono, 16-bit, signed, little endian (S16_LE). Vzorkovací frekvence == 8000 Hz. Jako popis to myslím stačí.
Zdrojové kódy: [link]
Datové soubory: [link]
Binárka: [link] (odpovědět) | _( | )_ | 85.132.197.* | 13.4.2008 13:39 |
|
|
|
re: Hlasová syntéza čísel | # |
| jak dlouho ti to trvalo než jsi to udělal ? (odpovědět) | MiKee | 90.176.215.* | 13.4.2008 13:41 |
|
|
|
re: Hlasová syntéza čísel | # |
| Par hodin. Kod jsem mel napsany za 2 hodky, pak jsem to jen doladil. nic na tom neni (odpovědět) | _( | )_ | 85.132.197.* | 13.4.2008 13:48 |
|
|
|
re: Hlasová syntéza čísel | # |
| (_|_) : moc pekne, ale ma to par bugu, je to asi proto ze jsi "to mel za dve hodinky".. :P <noflame>
Napriklad :
572 -> "sedmdesat sedm"
540 -> "ctyricet pet"
999 -> "devet"
321 -> "dvacet ctyri"
680 -> "osmdesat sest"
atd.. vypada to jak kdyby cisla nad 100 byly cteny random :D.. Zatim jsem neprisel v cem je problem :/
kompiloval jsem to v MinGW32 (Dev-c++) ale to by nemel byt imo ten problem :X
(odpovědět) | czYbph0 | 213.84.233.136/192.168.8.* | 13.4.2008 19:49 |
|
|
|
re: Hlasová syntéza čísel | # |
| Ja sem to testoval na vsechny cisla z toho rozmezi a zadnej bug tam nebyl... (teda je to ta jeho binarka) (odpovědět) | babca | 194.212.59.* | 13.4.2008 20:14 |
|
|
|
re: Hlasová syntéza čísel | # |
| No je to hezky :) a ani to neni tak slozity... btw jsem delal neco podnyho na prevadeni textu na morzeovu abecedu. Pekne :). (odpovědět) | babca | 194.212.59.* | 13.4.2008 14:24 |
|
|
|
re: Hlasová syntéza čísel | # |
| 3, 2, 1, FLAME, jinak good job ;)
----------
..:@]> [link] <[@:.. (odpovědět) | DjH | | | 319-960-895 | 13.4.2008 14:32 |
|
|
|
re: Hlasová syntéza čísel | # |
| aha, jak tak na ten zdrojak koukam, tak konkatenacni synteza je presne to, co jsem z nazvu vytusil :) zajimave :)
(odpovědět) | prc | 213.211.51.* | 13.4.2008 19:45 |
|
|
|
re: Hlasová syntéza čísel | # |
| Příště upni prosímtě zdrojáky na openpaste.org (či na jiné paste...)... (odpovědět) | C X | 82.113.53.* | 13.4.2008 20:49 |
|
|
|
re: Hlasová syntéza čísel | # |
| Takovych projektu "programovani picovin" bych udelal vice. Clovek si tak krasne procvici psani kodu a obnovi si v pameti veci, ktere vadnou ;)
Jenze na nejaky vetsi projekt tu asi nikdo schopnejsi nebude a delat to sam... nemam tolik casu. Mam na mysli VELKE projekty. Samozrejme C/C++ , databaze vseho druhu (MySQL, Firebird, Oracle, etc..) i Assembler x86 a x86_64. Mam v planu postavit si radar, ktery by byl pripojeny k pocitaci, na kterem by bylo patricne GUI a v podstate udelany cely system. Zatim potrebuju tak mesic, nez nastuduju neco z elektroniky ;)
Radar by mel umet toto: Zobrazovat vse, co je v okoli, tzn. auta, baraky, letadla, atd.... dosah cca 3 km. Na monitoru by se toto zobrazovalo z ptaci perspektivy, takze barak by byl ctverecek, panelak obdelnik, atd.... Ale vypracovat takovy system je uz velke sousto i na me. Takze by bodli tak 2 schopni koderi C++, co by zvladli plnit nejaky plan. Jako zmakl bych to i sam, ale je to tak na rok :D
Co se tyce financovani, tak to pujde z moji kapsy. (odpovědět) | _( | )_ | 85.132.197.* | 13.4.2008 21:58 |
|
|
|
re: Hlasová syntéza čísel | # |
| To co zde popisuješ se mi zdá jako pro amatéra technicky nerealizovatelné. Tebou popsané zařízení by totiž muselo být:
a) ve vzduchu, aspoň několik set metrů
b) postavené s použitím poměrně pokročilé technologie
Radiové vlny použité v radaru se totiž odrážejí, což by ti znemožnilo zobrazovat domy jako čtverečky z pohledu ptačí perspektivy, když by radar stál na zemi. Navíc, materiály ze kterých jsou domy vyrobené mají různé vlastnosti - jedny by se tvářili jako že tam nic není (to když by byl signál pohlcen), druhé by pro změnu zase házeli spoustu odrazů, které by se odráželi od dalších a dalších věcí, čímž by vznikal pěkný guláš. Další věc je pásmo a výkon. Musel by jsi si najít nějaké nelicencované pásmo a nesměl by jsi překročit určitý výkon. Navíc se bojím, že by se špatně shánělo(vyrábělo?) zařízení pro přijímání a vysílání signálu. Musí být totiž poměrně výkoné (záleží zase jak se to vezme) a citlivé. Dále je zde to, že nesmí rušit samo sebe.
Mno, tohle mě napadlo jenom tak, když jsem nad tím zběžně popřemýšlel. Je možné že už tě to taky napadlo, v tom případě by mě dost zajmalo, jak jsi dané problémy alespoň teoreticky vyřešil. Jinak to zní opravdu zajmavě, hodilo by se nějaké podrobnější info. (odpovědět) | |
|
|
re: Hlasová syntéza čísel | # |
| ja taky nevim jak to budu delat.... musim obvolat me stare IT zname co delaji u armady a poradit se, ziskat material, atd... S programovanim neni problem.
Samozrejme, ze nepojedu podle prirucky z phreaking.soom.cz nebo dokonce podle nejakeho clanku ze subber.php5.cz , kde by mi ten dynamit urval ruce ;) (odpovědět) | _( | )_ | 85.132.197.* | 14.4.2008 19:58 |
|
|
|
re: Hlasová syntéza čísel | # |
| btw, neco podobnyho jsem delal s lego nxt (pomoci ultrasonicu) ten se otacel a mapoval teren (meril vzdalenosti objektu cca asi po 15°) data ukladal do souboru a po otocce (360°) pomoci bt odeslal tyto data do ntb ten pomoci udaju udelal graf :), bohzel dosah byl asi jen do 2 m :(). Byla to picovina, ale u ucitelu to melo uspech :D (odpovědět) | babca | 194.212.59.* | 13.4.2008 22:38 |
|
|
|