Magyar Opera

MAMA csak egy van

Azt szeretem az Operában, hogy mindig meg tudják lepni az embert valami újdonsággal. Most, amikor mindenki a termékeik következő változatait illetve azok előzeteseit várja, megint előálltak valami váratlan újítással. Az első cikkek csak tegnap jelentek meg róla, de máris rengeteg információhoz juthatunk, ha elolvassuk őket. Az írások alanya, az Opera új üdvöskéje, a MAMA.

A MAMA születése

Miről is van szó? A neten lépten nyomon keresőket használunk. Akár úgy, hogy a legnépszerűbbeket (Google, Yahoo, Ask, Live Search...) közvetlenül felkeressük, akár kedvenc oldalainkon kutatunk valami után. Begépeljük a keresett kifejezéseket és jó esetben releváns információkat kapunk eredményül. Bár ezek a keresők mind megbízhatóságban, mind funkciókban jelentősen eltérnek egymástól, egy valamiben megegyeznek: az oldalak tartalmát vizsgálják.

A MAMA, mint azt a neve is mutatja (Metadata Analysis and Mining Application = kb. Metaadatokat analizáló és gyűjtő alkalmazás) egy keresőprogram, ami viszont nem a tartalomban keres, hanem - ahogy a készítők találóan megfogalmazták - minden másban.

A létrehozásának elsődleges célja az Opera böngésző tesztelése volt. Egy szoftvert úgy (is) tesztelnek, hogy élesben is kipróbálják, nincs ez másképp a böngészőkkel sem. Ez azonban a net mai mérete mellett szinte lehetetlen küldetés, rengeteg munkaidőt emésztene fel. Egyik megoldás lehet az automatizált ellenőrzés, amikor nem a tesztelő szörföl a neten, hanem egy program. Persze itt nehézséget jelenthet annak ellenőrzése, hogy valóban helyesen jelent-e meg az oldal. Esetleg mesterségesen generálunk "honlapokat", amik egy adott területre fókuszálnak. Persze ez valami olyasmi, mint a videokártyák tesztelésére 3DMark-ot avagy Crysis-t használunk. Előbbi ugyan pontosabban mutatja a hardver képességeit, de az utóbbival játszunk többet...

A másik lehetőség, hogy nem véletlenszerűen nézegetjük az oldalakat, hanem célzottan, egy adott funkció ellenőrzése végett. Ehhez viszont ismerni kellene azt, hogy melyik oldal épül fel olyan módon, ami a legalkalmasabb a kérdéses funkció vizsgálatára. Pontosan erre szolgál a MAMA: megkeresi azt a honlapot, ami legjobban megfelel a megadott keresőfeltételeknek. Szeretnél egy olyan honlapot találni, ahol oldalanként legalább 100 link, 50 kép és minimum 5 CSS fájl található? A MAMA használatával ez nem probléma! Olyan oldal kell, amiben Flash és Quicktime videó egyaránt be van ágyazva? Ez sem gond!

Mire használhatjuk?

Ha jól végiggondoljuk, a lehetőségek meglehetősen széleskörűek. Túl a fent említett alkalmazáson, a MAMA kifejezetten hasznos lehet a webfejlesztőknek. Egyfelől valós (tehát nem tankönyvi) példákat találhatnak az őket érdeklő technikai megvalósítások implementációira, másrészt - kellő számú oldal átvizsgálását és kielemzését követően eddig nem tapasztalt pontosságú képet kaphatnak az internet állapotáról, a leggyakrabban alkalmazott módszerekről, és legnépszerűbb technológiákról. Vagy időszakonként vizsgálódva képet kaphatunk a webes innovációk elterjedéséről, illetve annak időbeli és térbeli(!) lefolyásáról.

A lehetőséget az Opera sem hagyta ki, és mostanra egy elég impresszív adatbázist sikerült alkotniuk. Első körben ennek eredményeit osztották/osztják meg velünk cikkek és statiszikák formájában. A végső cél, hogy az adatbázis adatait az Opera Software-en kívül is elérhetővé tegyék valamiféle interfészen keresztül, de ennek időpontja, egyelőre ködbe vész. Addig is nézzük, mit találtak eddig:

Eddigi vizsgálatok eredményei

A vizsgálat 3 509 180 egyedi címre és 3 011 668 domainre és 217 országra terjedt ki . Mint a számokból látható, meglehetősen nagy mintáról van szó, a teljes netnek mégis csak egy kis töredékét teszi ki (a Google állítása szerint már több, mint egy trillió egyedi  címet regisztráltak a rendszerükben!). A készítők ezért igyekeztek minél nagyobbat "meríteni", ennek érdekében számos adatbázist vettek alapul a címek kiválasztásához. Többek között a Yahoo automatikus URL-generátorát, a DMoz-t (Open Directory Project), a W3C-tag vállalatok listáját, illetve az Amazon Alexa nevű szolgáltatásának TOP500-as listáját.

A fenti lapok megvizsgálásával az alábbi következtetésekre jutottak:

  • webszerverek terén az Apache a piavezető (67,72%), őt az MS IIS-e követi (25,91%), ez hangsúlyosabb fölény, mint a Netcraft mérése alapján
  • a főoldalak átlagos mérete 16 500 karakter
  • az oldalaknak alig a fele definiált Doctype-ot, ezek közül a HTML kétszer népszerűbb az XHTML-nél
  • az oldalak 85%-át hibatűrő módban jelenítik meg a böngészők
  • a W3C validátora alapján csak az oldalak 4,13%-a valid, ez az emelkedő tendencia ellenére borzasztóan kevés. Ráadásul a "W3C valid" plecsnivel rendelkező oldalaknak valójában csak a fele valid. 
  • a lapok harmada használ Flash-t valamilyen formában. A 20 legalaposabban vizsgált ország közül a legnagyobb arányban Kínában (67,03%) és Törökországban (59,85%) van jelen az Adobe beépülője, míg a legkevésbé Németországban (25,00%) és Dániában (25,33%) terjedt el.
  • az AJAX szempontjából rendkívül fontos XMLHttpRequest ugyanezen országok közül messze Norvégiában a legnépszerűbb (10,18%) szemben mondjuk a középmezőnyben tanyázó Franciaországgal (3,68%)
  • a CSS az oldalak 80,39%-ánál található meg. A három legnépszerűbb tulajdonság (property) a Color, a Font-size és a Font-family, a legnépszerűtlenebb pedig a Counter-reset.
  • a vizsgált honlapok 74,58%-a tartalmazott valamilyen szkriptet

A vizsgálatok alapján az átlagos internetes honlap az alábbi paraméterekkel bír:

  •  HTTP/1.1 protokoll
  • a fő dokumentum terjedelme 16 400 karakter
  • oldalanként 12 komment (a forráskódban), összesen 2250 karakter
  • karakterkódolás: iso-8859-1
  • 1000 karakternyi beágyazott CSS, plusz 1-2 külső stíluslap, nagyjából 8500 karakter terjedelemben, és az egyiket biztosan style.css-nek hívják
  • a külső szkriptek száma átlagosan két és fél, összesen 26500 karakterben
  • beágyazott szkriptek: 3,6 darab, 2500 karakter

Az alkotók további információkat ígérnek az elkövetkezendő hetekben, addig is mindenki olvasgassa az eddig elkészült (angol nyelvű) cikkeket!

Kapcsolódó linkek:

 

A bejegyzés trackback címe:

https://magyaropera.blog.hu/api/trackback/id/tr45717351

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

tetra · http://unsigned.freeblog.hu/ 2008.10.16. 21:27:40

Tiszta Discovery channel, éljünk a számok bűvöletében :D

deejayy · http://deejayy.hu/ 2008.10.17. 09:39:47

Ezek a statisztikák komoly muníciók lehetnek, amikor weblapról tárgyalsz az ügyféllel...
süti beállítások módosítása