Bystroushaak_ | 109.202.67.* | 11.9.2013 4:31 |
| To parsování jsi nemusel dělat přes beautifulsoup*, to by ti trochu času urychlilo (přeci jen, hledáš jen meta tagy, tak je zbytečné parsovat celou stránku, což není zrovna triviální proces). Nemusíš na to použít ani re, pár .split() by to mělo pořešit.
Místo threadů bych použil korutiny z stackless pythonu ([link]), těch můžeš mít podstatně víc.
Taky jsi mohl trochu vyčistit ten script na githubu, chápu, že takhle vypadá rychle napsaný hack, ale na publikaci bych to trochu zpřehlednil a nepoužíval jednořádkovosti v té formě, v jaké to tam máš. Chápu že takhle to jde taky, ale přeci jen, tohle jsi dal na web pro ostatní a tak by bylo pěkné, kdyby se v tom mohli dobře zorientovat.
Jinak dobrá práce, konečně někdo, kdo si dokáže poradit.
*BeautifulSoup je známá svou pomalostí. |
|