GOOGLE, CAFFEİNE İLE WEBE DARBE YAPTI!

medya | Etiketler:, , , — 20 Eylül 2010

SEO’cu tayfası muhakkak ki, Google’ın yeni indeskleme algoritması olan Caffeine hakkında birsürü şey yazıyorlardır. Okumuyorum; zira şu an için fazla bir açıklama yok. Yazılanlardan denk geldiğim birkaç tanesi, tahmin ettiğim üzere, afaki çıkarımlar üstüne kurulu.
caffeine 300x130 resmi Google, Caffeine ile webe darbe yaptı! yazısı medya  kategorisinde
Ancak, Google’ın resmi blogundaki açıklama, oldukça düşündürücü: İşte, Caffeine’in sürekli güncellenen içeriğe prim vereceğinin ifadesi:

“With Caffeine, we analyze the web in small portions and update our search index on a continuous basis, globally. As we find new pages, or new information on existing pages, we can add these straight to the index. That means you can find fresher information than ever before—no matter when or where it was published.”

Bu paragraf bile, aslında çok ciddi bir paradigma değişimine işaret ediyor: Google, tarihi boyunca daima, “kaliteli içerik üretin”, “Ne kadar çok yazdığınız önemli değil, eğer çalıp çırpıyorsanız, özgün değilseniz, puanınızı kırarız” dedi. Oysa size alıntıladığım paragrafta, özgünlük, içerik, kalite gibi hiçbir konuya vurgu yok. Hatta bahsedilmiyor bile!

Caffeine ile gelen bu değişimin, web kültürü ve yapısı üstünde kökten bir değişim yaratacağını kestirmek güç değil. Geçmişte, küçük girişimciler, mesela blog yazarları, kaliteli ve özgün içerik sayesinde medya devlerine kafa tutabildiler. Bir avuç girişimci ile kurulan portallar ya da niche siteler, hatta haber siteleri, ana akım medyayı internette mağlup etmeyi başardı. Aslında web, herhalde dünyadaki en ciddi demokrasi deneyiydi!

Google’ın bu adımını salt teknik bir karar olarak algılamak yanlış olur. Senelerdir, eğer IT şirketleri arasında bir “şeytan” olacaksa, bunun ancak Google olabileceğini söylüyordum. Çünkü elinde hem istatistik, hem özel bilgiler, hem reklam kanalı, hem Internet TV kanalı, hem cep telefonu işletim sistemi olan başka hiçbir şirket yok.(Google Maps’i de es geçmeyelim) Aslında, yaygın kanının aksine, elindeki tek güçlü ürün Windows olan Microsoft, bu alandaki en etkisiz aktör.

Caffeine ve onunla birlikte gelen bu çok açık “fikir değişikliği”, yıllardır tadını çıkardığımız bireysel yayıncılık devriminin çanına ot tıkayabilir. Zira artık Google, hızlı ve bol içerik üretene prim verecek. Bunun medya devleri için ne büyük bir fırsat olduğunu görebiliyor musunuz?

Murdoch’ ın Google’ a sert çıkışı, aslında ana akım medyanın, Google ile beraber web’i yeniden şekillendirme planlarının doğum sancısı olabilir mi?

Neden olmasın? Google, Internet’i yönlendiren en büyük ve aslında belki de tek kurumsal güç (Facebookda büyük bir güç, ama belli bir medya planı yok, Bing ve Yahoo etkisiz ve fazla kulvarda mücadele edemiyorlar). Ancak, Google, hala “gerçek dünyanın” medya devleri kadar büyük bir güç değil. Milyonlarca insanı belli bir noktaya -sinemaya örneğin- toplayamıyor, internet birçok alanda hala ana akım medyadan besleniyor ve trend belirleyemiyor (örneğin moda). Google, örneğin Murdoch ile ortaklığa gitse, ellerine geçirecekleri gücü tahayyül etmek bile ürkütücü. Bunu yapacak imkanları da fazlasıyla mevcut.

Bu belki yarın olmayacak ama internetin de artık “sahiplenip parsellendiğini” görmek lazım. Yıllardır, “dağılmak yerine birleşerek büyük siteler ve bloglar açın, yoksa silinip gidersiniz” diyorum; herhalde bu gelişmelerden sonra herkes biraz daha organize hareket etmek isteyecektir. Umarım…

GOOGLE CHROME ACAİP HIZLI!

bilgisayar | Etiketler:, , , — 4 Eylül 2008

Google’ın web tarayıcısı Google Chrome‘dan “az önce” bahsettim; açıkçası hızından ve temiz arabiriminden başka çok fazla konuşulmaya değer bir özelliği de yok. Öyleki, RSS desteği bile olmaması komik duruyor. Sanırım Google Labs, herkesin Google’a kayıt olup RSS beslemelerini oradan okuduğunu sanmakta.

Gelgelelim, hız konusunda “bu kadar hızlı olamaz” dediğimde yanılmışım. Bazı benchmarklara ulaştım ve Google Chrome’un Javascript performansı “oha” dedirten cinsten.

Bu arada, lisans anlaşmasını okursanız, “Google’ın isterse ekstra reklam gösterebileceği” tarzında bir ifade dikkatinizi çekecektir. Birkaç sene önce, yeni “şeytanın” Microsoft değil, Google olacağını söylemiştim. Elinde her imkan var. Umarım yanılırım demiyorum,çünkü yanılmayacağım. Bu kadar gücün insanı baştan çıkarmaması olası değil.


 resmi Google Chrome acaip hızlı! yazısı bilgisayar  kategorisinde

GOOGLE CHROME

bilgisayar,web | Etiketler:, , , — 3 Eylül 2008

google chrome.thumbnail resmi Google Chrome yazısı bilgisayar  kategorisindeBir süredir özgür yazılımla kanka olduğu izlenimi veren Google Labs, bu sefer Chrome ile nabız yokluyor.

Chrome, Firefox’dan KHTML’e kadar (Apple Safari) birçok “iz barındıran”, Google’ın yeni web tarayıcısı. Açıldığında, Opera ile Internet Explorer 7 karışımı bir browser ile karşılaşıyorsunuz. Açıkçası, hızını ve web sayfalarını doğru render etme özelliğini oldukça kayda değer buldum. Sayfanın görüntülendiği alanın oldukça büyük olması da artılarından biri; zira çoğu kullanıcı gibi bende F11 tuşunu kullanmayı sevmiyorum.

Bunun yanında, “öğeyi denetle” isimli çok hoş bir sağ tuş menüsü var. Bu araç, Mozilla Firefox’da vazgeçemediğim Firebug eklentisini andırıyor. Andırıyor diyorum; zira Firebug ile kıyaslandığında son derece primitif duruyor. Buna rağmen, yine de faydalı bir araç ve ilk çıkan sürümde olması gelecek vadedebileceğinin işaretlerini veriyor.

Sekmeli tarama özelliği elbette mevcut ve Opera’da yıllardır olduğu gibi, açılış sayfasına sık ziyaret ettiğiniz siteleri atabiliyorsunuz.

Oldukça etkileyici render hızı dışında, tarayıcının yüklenme hızı da gerçekten iyi. İlk dikkatimi çeken özelliklerden biri de, mouse’un scroll tuşunu kullandığımızda, sayfanın hızlı ve akıcı bir şekilde kayması oldu. Özellikle bloglar gibi, tuvalet kağıdı uzunluğunda sayfalar için küçük ama kullanımı kolaylaştıran, zekice bir detay.

Genel çalışma mantığı olarak, fena halde Firefox’u andırıyor; özellikle de sağ tuş menüleri.

Yine de, Google Chrome projesinden, bir nedenden ötürü hoşlanmadım: Firefox, kendi istatistiklerime göre, Türkiye genelinde bile %25 sınırını zorlarken, Google Chrome, Firefox’un hızını kesebilir. Bana göre Google’ın Mozilla Foundation’a maddi destek sağlaması, her ikisi açısından da daha olumlu bir adım olurdu.

İlk bakışta eklenti desteği yok gibi görünüyor; ancak Mozilla kodları zaten açık olduğundan, şayet isterlerse bu desteği de sağlamak zor değil. Bana daha çok, eski Intenet Explorer kullanıcılarını “caydırmak” için ortaya çıkmış, kullanımı basit ve temiz bir tarayıcı oluşturma çabası gibi geldi Chrome; belki bu yüzden, ileride çok gelişmiş özelliklere sahip olmasını beklemek yanlış olur.

BLOGMANİ – GOOGLE VE ALEXA VERİLERİNİ ÇEKMEK

bilgisayar,blog,web | Etiketler:, , , — 5 Ocak 2008

Daha önce, Technorati verilerini, Technorati API’si kullanarak çektiğimi söylemiştim.

Aynı şeyi, Alexa için yapamadım-miktar ne olursa olsun, Alexa API’lerini kullanmak için para ödemek zorundasınız.

Bu durumda, geriye iki seçenek kalıyordu: PHP’nin CURL fonksiyonları, ya da sayfaya soket açıp, sayfa içeriğini işlemek.

CURL kullanmanızı tavsiye etmem: aslında harika çalışıyor; ancak makinaya minimal bir Apache kurduktan sonra, CURL fonksiyonlarının çalışmadığını farkettim. Standart Apache kurulumu ile gelmeyen çoğu kütüphaneyi kullanmak risklidir – sunucunuzda da o fonksiyonlar olamayabileceğinden, bilgisayarınızdaki web sunucusunda güzel güzel çalışan projeniz, hostunuz üzerinde patlayabilir.

O zaman, ben de soket açarım dedim ve fsockopen’ı bol bol kullandım!

fsockopen ile açtığınız sayfalardan spesifik bir bilgiyi alabilmek için, Regular Expressions’ın kucağına düşüyorsunuz. Eğer çok iyi düzeyde Reg Ex bilginiz yoksa -benim gibi!- ve problemi hızlı çözmek zorundaysanız, bildiğiniz kadar Reg Ex ile, sprintf (ve türevleri) ile birlikte, PHP’nin katar işleme fonksiyonlarını kombine kullanın. 15 sene önce olsa farklı konuşurdum; artık yazılım geliştirmek kolay ama zaman çok kısıtlı. Günümüzde en kıymetli kodcu, hızlı olan. Bilgisayarlarda çok hızlı olduğundan, genelde yazabileceğiniz en kötü kod bile, aletlere ter attıramıyor. (Simulatör, 3D oyun, ya da genetik alanında kullanılan tarzda karmaşık programlar yazmadığınızı varsayıyorum!)

Alexa sorununu nispeten kolay çözdüm; zira verilerin düzenli bir XML formatında geldiği bir sayfaya çengel atmayı başarabildim!

Google API’leri günde 1000 sorguya izin verdiği ve sonuçları hala parse etmeniz gerektiği için, yine API kullanmama kararı aldım.

Google ile işim, kolay görünmesine rağmen, biraz maceralı geçti. Pagerank’i alan kodu Internet’ten 10 dakika içinde çalıp(!) neredeyse aynen kullandım. Gelgelelim, arama sonuçlarını veren bir kod bulamadım. Bulduğum üç örneğin ikisi CURL’e dayandığı için, daha ilk anda çalışmadılar. Üçüncü, soket kullanan örnek ise, yazılan yanlış Reg Ex ifadeleri yüzünden çalışmıyordu.

Kolları sıvayarak 2-3 saat içinde, link sayısını veren Google kodunu yazdım. Aslında, uzamanın nedeni, yine bir Reg Ex-PHP azizliğiydi…

Benim kullandığım Apache+PHP sunucusunda, Unicode’dan (UTF-8), ISO tabanlı dil kodlamalarına çeviri yapan fonksiyonlar çalışmıyor. (Açıkcası, hala geliştirilme aşamasında ve PHP’yi ICU desteği ile derlemeniz gerek). Sorun şu; sayfadan Türkçe karakterler geliyor ve Reg Ex, Unicode anlıyor olması gerektiği halde, anlamıyor ve unicode karakterleri bulamıyor. Çözüm? Unicode harfler yerine, Reg Ex’in (.) -nokta- güzelliğini kullanmak! Böylece, katarınız içindeki unicode karakterlerini “her ne gelirse” diye geçiştiriyorsunuz. Harika bir çözüm değil ama her koşulda işe yarıyor. En azından, insanlar php.net’te ve forumlarda “reg ex ile unicode işleyemiyoruz” diye ağlaşırken, siz geminizi yürütüyorsunuz.

Sonuç olarak, Google Pagerank, link sayısı ve Alexa verileri gibi bilgileri de çekmeyi başardım. Technorati işini de dün çözdüğüm için, geriye birkaç iş kaldı.

Bunlardan biri, çektiğim verileri veritabanına yazmak. Bu, en kolay iş.

İkincisi, bu sitelere ulaşılamadığında, scriptimin neler yapacağına karar verecek ek fonksiyonları yazmak. Örneğin, Technorati’den veri gelmezse, tekrar deneme yapılacak mı? Kaç kere denenecek?

Bu tip detaylar…

Üçüncüsü, bu modülü ne zaman ve nasıl çalıştıracağıma karar vermek. Bunun içinde sunucu üzerinde bazı denemeler yapmak gerekiyor. Örneğin, bana üzerinde cron çalıştırmak için izin veriyor mu? Şayet cron iznim yoksa, scripti manuel çalıştırmak gerek.

Son olarak, iş puanlama algoritmasını çıkarmaya kalıyor. Bu iş aslında son derece basit. Tek bir zorluğu var; o da adil ama rekabetçi bir algoritma çıkarmak.

Umuyorum, bir ve iki numaralı maddeleri Pazar ve Pazartesi günü hallederim.

YENİ GOOGLE PAGERANK ALGORİTMASI ORİON NE GETİRECEK?

bilgisayar,web | Etiketler:, — 2 Ekim 2007

Açıkçası Lyn‘de duydum Orion adını; elbette orada duymadım ilk kez, şimdi Firaxis’in sahibi olan Sid Meier’in Master Of Orion’ınını az oynamadım; Orion kültünü filan da bilirim. Ama Google’ın yeni bir algoritma kullanacağını bilmeme rağmen, Orion’dan haberim yoktu.

Neden mi yoktu haberim? Çünkü Google’ın ne yaptığıyla pek ilgilenmiyorum. Kafama göre, olabildiğince iyi, çok ve hızlı yazmaya çalışıyorum. Yalakalık yapayım, ondan bundan link alayım, acaba topliste filan mi girsem, kayıt olsam hangisi iyidir gibi kaygılarım yok. İnsanlar blogumu Google’dan bulsunlar, ama hakediyorsam. Zaten işim başımdan aşkın, bir de link dilenciliği yapsam yazmaya vaktim olmaz, zaten benim karakterime uyan bir hareket de değil.

Lakin “neymiş ki Orion” dedim; mevcut düzeni pek beğenmediğim için, acaba daha iyi birşey mi geliyor diye merak ettim.

Efendim; hitnews’daki yazının özeti şudur: Ori Allon diye, 26 yaşında Ph D yapmakta olan bir genç var. Gencimiz, üniversitede (Avustralya’da bilmemne üniversitesi, south new wales filan gibi, Avustralya’ya zamanında İngiltere’de ne kadar suçlu ve zevzek sürmüşler ya, onun için mekan adları hep İngiltere’den) ilim irfan yaparken (yok,Yahudi, Adnan Oktar’la işi olmaz) “ben bir arama motoru (araba motoru değil) algoritması geliştirivereyim diyor, hocalarıda (Fethullah Gülen hocaefendi değil, proflar filan) pek beğeniyor, kafasını okşuyor, “Aferin Oli, biz şimdi bunu Yahoo, Google, Microsoft’a filan çakarız” diyorlar.

Lakin Google yemi hemen yutmuyor. Sonunda imana geliyorlar, Oli Allon’a “gel bize takıl, bok gibi para veririz, algoritmanın adını da Orion koyarız” diyorlar. Oli, Ph D’yi yarım bırakarak, elinde tahta bavulu, Google’ın yolunu tutuyor. Ama üniversite de payını alıyor bu işten, çünkü onlarda döner sermaye yok, enayiler kantin açıp döner satmayı, otopark işletmeyi beceremedikleri için bütün gün hafızlayıp duruyorlar. Çünkü orada YÖK yok. (Belki Vietnamda filan vardır).

Bu arada, zamanında Orion’u duyan Bill Gates’de, Allon’un sırtını sıvazlayıp “aferin evladım” demiş; ancak para mara vermemiş. (Gates, Allon’dan daha Yahudi çıkmış!)

Oli, “ben bu işi 18 ayda gömerim abi” demiş; hadi bakalım.

Algoritma konusunda muhtelif spekülasyonlar var.

Gelgelelim, bizim basının sadece Türkiye’de yaşamadığını da öğrenmiş oldum (şimdi anlıyorum Reha Muhtar’ın “her nerede yaşıyor ve yaşatılıyorsan” lafını). Sydney Morning Herald da şöyle bir paragraf var:

Orion finds pages where the content is about a topic strongly related to the key word. It then returns a section of the page, and lists other topics related to the key word so the user can pick the most relevant.

The results of the query are displayed immediately in the form of expanded text extracts, giving the searcher the relevant information without having to go to the website – although there is still that option.

Anlayan varsa bana da anlatsın.

Lakin herkes kendi fikrini de “sıkmış” arada…

Ori’nin doktora teziyle ilgili bir sayfa buldum.

“Take a search such as the American Revolution as an example of how the system works. Orion© would bring up results with extracts containing this phrase. But it would also give results for American History, George Washington, American Revolutionary War, Declaration of Independence, Boston Tea Party and more. You obtain much more valuable information from every search.”

Yani diyor ki -mealen- Amerikan Devrimini araştırınca bize Amerikan tarihi,George Washington vs vs ile ilgili sonuçları da getirecekmiş.

Eğer bunu yapacaksa yandık. Şu durumda bile, aradığımızla ilgili sayısız alakasız sonuç alırken, bir de yeni algoritmayla olacak şeyleri düşünün.

Örneğin; Paris’i arıyorum. Paris Hilton sanacak, gerizekalılık, porno, vibratörle ilgili sonuçları filan da getirecek. Tabii o sayfada bunlar da varsa, ama emin olun ki vardır. Olmasa bile, zamanla webmaster’lar, “oldurmak” konusunda uzmanlaşacaklar…

Mesela Paris’teki Hilton otelini arıyorum, İngilizcem bozuk, Çinliyim ya, yazıyorum “Hilton in Paris”, oo gelen sonuçları düşünmeyin. Muhtemelen 112 sayfa sonuç çıkacak, ilk sırada soyadı Hilton olan, Paris Hilton’la düşük kalkmış herifler listesi.

Yani durum bana biraz yaş geldi.

Ama artık link alıp vermenin önemi olmayacakmış. Nasıl yani? 10.000 link alan siteyle, dün açılan site aynı mı olacak? Hiç sanmam. Ha, Internet yalakalarını yıldıracaksa ona da varım, ayrı konu. Hırsızları da çarpacakmış; mesela sen şimdi bu yazıyı benim siteden çalıp kendininkine monte ediverdin, Google senin siteni göstermeyecek,ya da diplerde gösterecek, en başta benimkini gösterecek..miş.

Nasıl olacak, mesela % kaçını çalmak hırsızlık sayılacak? Ya da şöyle düşünelim; Google’ın basın açıklamasından yukarıdaki satırları aldım, sonra Oli’nin üniversitesi aslında kendi hazırladığı tanıtıcı yazıyı bir süre sonra yayınlamaya karar verdi; ama bu arada yazıdan bir parçayı ben daha önce yayınlamış oldum. Bu durumda, benim sitem daha önce çıkacak arama sonuçlarında. İyi de, zaten mevcut durum da bu!

Özet olarak ben şunu anladım: “Biz aynen devam ediyoruz, sadece ek olarak ilgililik parametresini biraz geliştirdik”

Yeni birşey midir bu? Hayır. Bakınız PHP’nin similar_text fonksiyonu; buna çok benzer bir iş yapar. Azıcık geliştirirsiniz, Orion’da olur, Sirius da olur.

İSTATİSTİKLER

Blogumda toplam 6125 yorum ve 880 blog girdisi bulunuyor.

ARŞİV

12