Đizus... ne želim ni znati koja mašinerija stoji iza ovoga...
- +/- sve poruke
- ravni prikaz
- starije poruke gore
samo malo, to znači da će mi Google Bot svakih koliko (par sati?),rovati po stranici (downloadati podatke) kako bi dobio eventualne izmjene. OK, ovo nije loše - međutim mogu li si ja, tj. netko drugi priuštiti tako nešto ? Dosta ljudi nema neograničen bandwidth, već je na prosječnom shared hostingu. Svako prekoračenje bandwidtha se naravno plaća.
Nadam se da sam u krivu i da je posrijedi nešto drugo...
Za svaku pohvalu!
Ne mogu ni zamisliti kako će internet izgledati kroz desetak godina, ali jedno je sigurno - Google će još uvijek biti tu 
Đizus... ne želim ni znati koja mašinerija stoji iza ovoga...
kolika je instalirana snaga u posjedu googlea baš me zanima kao i broj servera. a kolika je tek cifra koju ne moraju platiti ms-u za licence servera. šteta, da bar malo više vrate u razvoj linuxa. imaju jednog čovjeka koji je među top 5 razvijatelja, andrew morton a ostali slabo. kao kompanija su 13. a bez mortona su 40. po redu u razvoju kernela. malo, za takvu tvrtku malo.
Vjerovatno se radi o tisucama servera samo za trazilicu... I to mislim samo za serviranje podatka, ne za prikupljanje i obradu.
Toliku kolicinu upita i tako brzo obraditi je faking znanstvena fantastika.
Da ne spominjem opremu za servanje gmaila koji je isto tako brz i fluidan, fak, brzi je nego dosta webmailova kod velikih stranih hostinga.
"nakon što algoritam pregleda cijeli web"
Baš nije u redu da se ovako sramotite.
Vjerovatno se radi o tisucama servera samo za trazilicu... I to mislim samo za serviranje podatka, ne za prikupljanje i obradu.
Toliku kolicinu upita i tako brzo obraditi je faking znanstvena fantastika.
Da ne spominjem opremu za servanje gmaila koji je isto tako brz i fluidan, fak, brzi je nego dosta webmailova kod velikih stranih hostinga.
Jesi vidio kad google-ove servere? Veličine brodskih kontejnera su, a imaju ih brdo. Točnije nije server tako velik nego su spremljeni u takve kontejnere.
Gledao sam jednom testiranja na potres, požar itd.
Vjerovatno se radi o tisucama servera samo za trazilicu... I to mislim samo za serviranje podatka, ne za prikupljanje i obradu.
Toliku kolicinu upita i tako brzo obraditi je faking znanstvena fantastika.
Da ne spominjem opremu za servanje gmaila koji je isto tako brz i fluidan, fak, brzi je nego dosta webmailova kod velikih stranih hostinga.
2005.
. danas nek ima 20-30% više. pomnoži to sa brojem takovih farmi kojih predpostavljam moraju imati "puno" , mislim da se lako dođe do brojke servera koja se broji u milijunima, odokativnom metodom."Moderne web stranice bogate su sadržajem koji se brzo mijenja i nadopunjuje, a Caffeine bi trebao pružiti 50 posto svježije informacije pretrage nego što je to do sada bio slučaj."
Pa ne izgleda bas kao neki napredak... Znaci umjesto stranica starih 3 mjeseca, dobit cu stranicu staru 2 mjeseca... Da je 50x to bi bio napredak, ali 50%? 
Vjerovatno se radi o tisucama servera samo za trazilicu... I to mislim samo za serviranje podatka, ne za prikupljanje i obradu.
Toliku kolicinu upita i tako brzo obraditi je faking znanstvena fantastika.
Da ne spominjem opremu za servanje gmaila koji je isto tako brz i fluidan, fak, brzi je nego dosta webmailova kod velikih stranih hostinga.
Jesi vidio kad google-ove servere? Veličine brodskih kontejnera su, a imaju ih brdo. Točnije nije server tako velik nego su spremljeni u takve kontejnere.
Gledao sam jednom testiranja na potres, požar itd.
Evo pogledao sam na YT... prestrasno :)
ma kakva 2 mjeseca??
google je i bez tog algoritma svak ustranicu bar jedamput dnevno pregledao, a one naj popularnijei puno puta više (čuo sam npr cnn 3600 puta na dan) ali novi algoritam omogćuje još svježije podatke
npr Cnn će provjeravat opet 3600 puta na dan ali dio za vijesti 5400 puta (50% više)
"Moderne web stranice bogate su sadržajem koji se brzo mijenja i nadopunjuje, a Caffeine bi trebao pružiti 50 posto svježije informacije pretrage nego što je to do sada bio slučaj."
Pa ne izgleda bas kao neki napredak... Znaci umjesto stranica starih 3 mjeseca, dobit cu stranicu staru 2 mjeseca... Da je 50x to bi bio napredak, ali 50%? 
Eh kako čovjek izmisli situaciju koje nema i na osnovu nje kreira nepostojeći problem. Ajde mi reci kad si zadnji put dobio 'stranicu' staru tri mjeseca, a da se njen sadržaj u međuvremenu promijenio? Prvo odmah u početku si krivo postavio stvari jer nije bit u tome koliko su stare stranice već koliko su stare informacije na tim stranicama i naravno kojim se tempom one mijenjaju. Za stranice sa fiksnim sadržajem potpuno je nebitno da li su zadnji put indeksirane prije 3 mjeseca ili prije tri minute. Googleov algoritam funkcionira na način da stranice sa češćim izmjenama provjerava češće, a s ovim novim algoritmom su su stvari dodatno prilagodili dinamici promjena.
To je ujedno i odgovor onome koji se boji da će mu Google pojest ograničen promet na hositngu :). Ako sadržaj svoje stranice mijenjaš u onda bi ti trebalo biti i u interesu da se te promjene čim prije indeksiraju i pojave kao rezultat možebitne pretrage za istim sadržajem, a ako već imaš stranice trebao bi znati da indeksiranje ne guta megabajte i megabajte podataka svaki put jer bi to bilo izuzetno neefikasan način već algoritam pokušava prepoznati nastale promjene i njih uvrstiti u indeks.
"Moderne web stranice bogate su sadržajem koji se brzo mijenja i nadopunjuje, a Caffeine bi trebao pružiti 50 posto svježije informacije pretrage nego što je to do sada bio slučaj."
Pa ne izgleda bas kao neki napredak... Znaci umjesto stranica starih 3 mjeseca, dobit cu stranicu staru 2 mjeseca... Da je 50x to bi bio napredak, ali 50%? 
Eh kako čovjek izmisli situaciju koje nema i na osnovu nje kreira nepostojeći problem. Ajde mi reci kad si zadnji put dobio 'stranicu' staru tri mjeseca, a da se njen sadržaj u međuvremenu promijenio? Prvo odmah u početku si krivo postavio stvari jer nije bit u tome koliko su stare stranice već koliko su stare informacije na tim stranicama i naravno kojim se tempom one mijenjaju. Za stranice sa fiksnim sadržajem potpuno je nebitno da li su zadnji put indeksirane prije 3 mjeseca ili prije tri minute. Googleov algoritam funkcionira na način da stranice sa češćim izmjenama provjerava češće, a s ovim novim algoritmom su su stvari dodatno prilagodili dinamici promjena.
To je ujedno i odgovor onome koji se boji da će mu Google pojest ograničen promet na hositngu :). Ako sadržaj svoje stranice mijenjaš u onda bi ti trebalo biti i u interesu da se te promjene čim prije indeksiraju i pojave kao rezultat možebitne pretrage za istim sadržajem, a ako već imaš stranice trebao bi znati da indeksiranje ne guta megabajte i megabajte podataka svaki put jer bi to bilo izuzetno neefikasan način već algoritam pokušava prepoznati nastale promjene i njih uvrstiti u indeks.
ciao, pa ovak -
kako mislis da ce Google uspjeti "vidjeti promjene" na stranici, ako ne prvo skinuti cijeli zadrzaj i onda usporediti izmjene ? A koliko to guta podataka, pa zamisli da je jedna stranica velicine 50 Kb - a ima ih recimo 10000 (dinamicki generiranih) - sto je i dalje brojka koja je prihvatljiva za shared hosting, brojka s kojom ne mozes zaraditi dovoljno da platis racune Dedicated Servera i da budes na pozitivnoj nuli - i brojka s kojom bih bio zabrinut ako ce je Google ici indeksirati.
Ali kako kazem, nadam se da sam u krivu i da je posrijedi nesto mnogo inteligentnije.
"Moderne web stranice bogate su sadržajem koji se brzo mijenja i nadopunjuje, a Caffeine bi trebao pružiti 50 posto svježije informacije pretrage nego što je to do sada bio slučaj."
Pa ne izgleda bas kao neki napredak... Znaci umjesto stranica starih 3 mjeseca, dobit cu stranicu staru 2 mjeseca... Da je 50x to bi bio napredak, ali 50%? 
Eh kako čovjek izmisli situaciju koje nema i na osnovu nje kreira nepostojeći problem. Ajde mi reci kad si zadnji put dobio 'stranicu' staru tri mjeseca, a da se njen sadržaj u međuvremenu promijenio? Prvo odmah u početku si krivo postavio stvari jer nije bit u tome koliko su stare stranice već koliko su stare informacije na tim stranicama i naravno kojim se tempom one mijenjaju. Za stranice sa fiksnim sadržajem potpuno je nebitno da li su zadnji put indeksirane prije 3 mjeseca ili prije tri minute. Googleov algoritam funkcionira na način da stranice sa češćim izmjenama provjerava češće, a s ovim novim algoritmom su su stvari dodatno prilagodili dinamici promjena.
To je ujedno i odgovor onome koji se boji da će mu Google pojest ograničen promet na hositngu :). Ako sadržaj svoje stranice mijenjaš u onda bi ti trebalo biti i u interesu da se te promjene čim prije indeksiraju i pojave kao rezultat možebitne pretrage za istim sadržajem, a ako već imaš stranice trebao bi znati da indeksiranje ne guta megabajte i megabajte podataka svaki put jer bi to bilo izuzetno neefikasan način već algoritam pokušava prepoznati nastale promjene i njih uvrstiti u indeks.
ciao, pa ovak -
kako mislis da ce Google uspjeti "vidjeti promjene" na stranici, ako ne prvo skinuti cijeli zadrzaj i onda usporediti izmjene ? A koliko to guta podataka, pa zamisli da je jedna stranica velicine 50 Kb - a ima ih recimo 10000 (dinamicki generiranih) - sto je i dalje brojka koja je prihvatljiva za shared hosting, brojka s kojom ne mozes zaraditi dovoljno da platis racune Dedicated Servera i da budes na pozitivnoj nuli - i brojka s kojom bih bio zabrinut ako ce je Google ici indeksirati.
Ali kako kazem, nadam se da sam u krivu i da je posrijedi nesto mnogo inteligentnije.
Sigurno si u krivu.Ti kao obični korisnik ne možeš znati što se dešava iznutra(jedino ako nemaš vezu u Googleu
),ali vjeruj mi,ne bi to oni radili da im se ne isplati(a iza svega toga stoji žešća matematika,ekonomija,programiranje).
Koliko znam googlebot posjećuje redovito neku stranicu koliko je vlasnik te stranice definirao u sitemaps.xml datoteci, tako da ako definiraš da imaš izmjene tjedno dolazititi će tjedno, ako staviš mjesečno dolaziti će mjesečno itd..., uglavnom ako imaš site koji se ne mjenja neće ti se ništa spektakularno desiti, ali ako recimo imaš neki news site, portal ili forum tada bi trebao vidjeti puno prije info na googlu, i tada bi ti u svakom slučaju bilo u interesu da ti googlebot non stop refresha sadržaj. Probaj razmisliti o promjeni hostinga ako misliš da bi ti googlebot nabio bandwith
Ali kako kazem, nadam se da sam u krivu i da je posrijedi nesto mnogo inteligentnije.
skidati cijeli sadržaj radi usporedbe?! ne bih rekao.
Što god bilo, moćno
Đizus... ne želim ni znati koja mašinerija stoji iza ovoga...
http://gizmodo.com/5517041/googles-insane-number-of-servers-visualized
okeee to je malo puno


