pyro | 195.28.76.* | 18.2.2011 8:35 |
| staci pouzit callback, regular expression / xpath.
postup:
1. aplikuj callback na google search. V googl search pouzi kriteria podla akych potrebujes najst maily. pomocou skriptu odstran vsetky nepotrebne casti vystupu callbacku, aby ostal cisto text - plain, inner, outer (podla potreby)
2. priklad vyrazu pro mail search: "?mail: ~personal? oddelen~"
3. na cisty vystup z bodu 1., v ktorom sa nachadzju najdene polozky, treba pouzit regular expression. extrahovat z vystupu len tie polozky, ktore su relevantne pre vystup - napr: "((?:[a-z][a-z]+))(.)([a-z])" - > vyselektuje slovo "personal".
4. tymto postpom dostanes napriklad:
-nadpis polozky (...nemocnice » Personál odd...)
-obsah polozky (Personál oddělení. Prim. MUDr. Marie Holbová: e-mail: marie.holbova@nem-km.cz: telefon: ( +420 ) 573 322 381)
-linku k zdroju: (...cz/oddeleni/ocni/ocni-personal/)
5.
a) bud vyextrahujes callback vystup a dostanes svoje mena, kontakty, maily, povolani
b) pouzijes xpath na vyhladanou linku a z te nasledne vycucnes cokoliv co je treba
end |
|