Shromazdovani informaci- 2 - Google a vyhledavani

Zdroj: SOOM.cz [ISSN 1804-7270]
Autor: ask@t
Datum: 8.1.2007
Hodnocení/Hlasovalo: 2/16

V tomto clanku se pokusim vysvetlit metody vyhledavani na googlu.

Predtim nez zacneme na googlu shanet informace, musime se naucit jak google s nasim dotazem naklada.
Predpokladam zakladni znalost operatoru googlu.
Nejdrive si predstavim par zakladnich pravidel ktera budeme pouzivat pri hledani.
1.Google nerozlisuje velikost pismen!!-->jedinou vyjimkou je slovo or ktere kdyz se napise velkymi pismeny(OR) funguje jako booleanovsky operator.

2.Zkraceny zapis slov:Google automaticky pouziva zkraceny zapis slov. Pokud dame vyhledat slovo dietary vyhleda i slovo diet.(u cestiny vetsinou zkratky nezna)

3.Ignorace: Google si vyhrazuje pravo vas ignorovat.Ve vyhledavani ignoruje vetsinou bezna slova, znaky a jedine cislice.(tzv:stop words)

4.Deset a dost:Dotaz Googlu muze obsahovat maximalne deset slov(hvezdicka (*) se nepocita)(kazde cislo se pocita-->> "Apache 1.3.26" jsou 4 slova)

5. znak * zastupuje jakekoliv slovo

6.Nebudeme pouzivat operatory se slovem all.To jest :allintext:,allintitle:,allinurl:...atd.Jsou (mimo urcite pripady) velmi neprakticke a temer SE NEDAJI KOMBINOVAT S JINYMI OPERATORY.

7.Pokud pouzivame prohlizec Opera zvolime Show generic selections on graphical ads ve File-->preferences-->advertising.


A.Syntaxe operatoru ve vyhledavani.



Ackoliv se to zda divne, google cte operatory zleva doprava:--)(dobra tak moc divne to neni)O algebraickou spravnost dotazu se nezajima.
priklad dotazu:
intitle:password | passcode intext:username | userid | user filetype:csv
Vyhleda soubory jez maji v titulku slova password NEBO passcode.
Z nich vybere ty, ktere maji v textu stranky slovo username NEBO userid NEBO user.
Z nich vybere ty, ktere maji priponu csv.
Dotaz pro lepsi porozumneni muzeme zazavorkovat:
intitle:(password | passcode) intext:(username | userid | user) filetype:csv
Tato syntaxe je pro nas prijatelnejsi a google ji pochopi a najde totez jako pri prvnim dotazu bez zavorek.:-)

B.Redukce vyhledavani

Abyste nasli relevantni vysledky, je nutno hledani zuzovat tim, ze dotaz postupne upravujeme. A protoze nejlepsi moznost jak se ucit je na prikladech, tak si jeden ukazeme. Podivame se treba na Zebra GNU coz je zadarmo dostupny software, ktery spravuje smerovaci protokoly zalozene na tcp/ip. Zebra GNU pracuje se souborem zebra.conf do ktereho uklada konfiguracni nastaveni(vcetne informaci o rozhrani a heslech :-) Stahneme tudiz zebru k nam zebra software Vsimneme si ze soucasti dodavky je soubor zebra.conf.sample. Vypada takto:

! -*- zebra -*-

! ! zebra sample configuration file
!
!
! $Id: zebra.conf.sample,v 1.14 1999/02/19 17:26:38 developer Exp $
!
!
hostname Router
password zebra
enable password zebra
!
! Interface's description.
!
!interface lo
! description test of desc.
!
!interface sit0
! multicast
!
! Static default route sample.
!
!ip route 0.0.0.0/0 203.181.89.241
!
!log file zebra.log


Pokusime se vypatrat soubory dotazem
"! Interface's description. "
To povazujeme za vyhledavaci zaklad.Mel by byt co mozna jedinecny, abysme se dostali co nejblize k relevantnim vysledkum. Tento zaklad ktery jsme pouzili je jedinecny, protoze jsme do vyhledavani zaradili presnou frazi i s vykricnikem a teckou na konci.
Google si ovsem s nasim dotazem pohral a vyhleda i veci ktere nas nezajimaji.Vsimnete si, ze (v dobe kdy tento clanek pisi)se na prvnich 10-ti mistech nenachazi ani jeden soubor .conf
Nas zaklad tedy zredukujem a dotaz upravime na
"! Interface's description. " zebra.conf
Nase vyhledavani jsem sice zuzili, ovsem na ukor poctu spravnych hledanych vysledku. Mnoho uzivatelu totiz jen upravi ukazkovy soubor a zmeni v nem jen ta nastaveni, ktera jsou potreba zmenit v jejich prostredich. Timpadem muze mit uzivatel pod souborem zebra.conf.sample ulozeny "zivy" konfiguracni soubor.

Na redukci se timpadem podivame jinym zpusobem.V souboru zebra.conf.sample je radek s obsahem: hostname Router. Predpokladame ze pocitac se nejmenuje Router. Dotazem
"! Interface's description. " zebra.conf -"hostname Router" opet zuzime vyhledavani.
Timpadem (temer)vsechny soubory, jez slouzi jen jako priklad vyloucime a zustaji nam jen soubory ktere vykonavaji svou funkci. Mozna jste si vsimli, ze ne vsechny vysledky jsou ty, ktere hledame. Tohleto totiz neni uplne nejlepsi dotaz jaky muzeme sestavit. K perfektnimu dotazu nas privedou pokrocile operatory inurl a intext.(jak je pouzit urcite vite)

C.TRAVERZOVANI

Techniky traverzovani (angl:traversal) znamena "cestovat po necem". Tyto techniky se pouzivaji k tomu abysme z objevene stranky vytezili co nejvic informaci.

1.Cestovani po adresarich.

Za priklad vam davam vypis adresare, ktery jsem nasel jednoduchym dotazem. intitle:"index.of" inurl:"/admin/"
Nachazim:screenshot
Klikem na parent directory se dostavam do korenoveho adresare
screenshot
A tam vidim slozku auth (Asi tusite co v tom bude)
screen
A mame tady kompletni material, pomoci ktereho muzem zjistit, jak server zachazi s vlozenymi daty.Zlaty dul pro SQL a PHP injekce.
Mozna se vam to zda jednoduche.Vtip je v tom, ze to jednoduche je, ale divili byste se, kolik lidi hleda stripky informaci v jedne slozce a o pod-adresare a nad-adresare se nezajima.

2.Inkrementalni(a pochopitelne dekrementalni) substituce

Touto technikou vetsinou hledame data, ktera s tim co jsme nalezli primo souvisi. Jedna se o jednoduchou zmenu jmena souboru v URL.(V 99-ti procentech se (jak z nazvu vyplyva> jedna o cisla)
Priklad
http://users.ece.gatech.edu/~owen/Academic/
ECE4112/Fall2005/Projects/Botnets3.doc

Ve svem hledani jsme objevili tento soubor.Pokud se chceme dostat do adresare project tim, ze umazem jmeno souboru obdrzime chybu 403.
Technika substituce je vlastne jen snaha uhadnout jmena souboru v adresari.Jak jste si urcite vsimli, soubor se jmenuje botnets3.doc
Vtip je v tom, ze cislo 3 nahradime cisly 4,2,1 nebo je uplne vynechame.Dostaneme se tak k dalsim materialum.
Tuto techniku lze vlastne pouzivat na vse, co obsahuje cisla.Velke ovoce taky prinasi zmena parametru skriptu.
(Ovsem o tom by se dala napsat kniha a pokud umite s googlem tak si to vyhledate sami)

3.loveni pripon(angl:extension trolling nebo extension walking)

Zmena pripon muze pri spravnem pouzivani velmi pomoci.Mezi nejoblibenejsi zpusoby patri zmenit index.php na index.php.bak
Server si se souborem bak nedokaze poradit a tak ho vypise jako prosty text.Timpadem se dostavame ke zdrojovymu kodu, ktery drive obsahoval index.php
Presto, ze se soubor .bak muze od souboru index.php lisit, vime alespon jak se s daty zachazelo a pokud nebyly opraveny nejake bezpecnostni chyby bude soubor index.php nechylny ke stejnemu utoku jako index.php.bak

zaverem

Mozna, ze jste zde cekali nejake tabulky s dotazy, ktere patraji po super tajnych heslech. Bohuzel, v pristim clanku sice zverejnim par tabulek s dotazy, jez slouzi k hledani konkretnich cilu, ale bez zakladni znalosti systemu a techto postupu vam budou absolutne k nicemu. Pokud chcete najit opravdu dobre vysledky existuje jen jedna cesta(vlastne tri:-)
                                                        --->1.zkouset vlastni dotazy
                                                        --->2.upravovat ty cizi
                                                       --->3.vytezovat z vysledku maximum. Tu treti vec jsem se snazil popsat tady. V pristim clanku se pokusim zverejnit par tabulek s dotazy, ktere nachazi jednotlive typy serveru, programoveho vybaveni a mozna taky ruzne exploity.:-)