Մեր հոդվածներից
մեկում մենք ներկայացրել էինք PageRank*-ի էությունը եւ այն որոշիչ առավելությունները, որոնց շնորհիվ PageRank-ը մեկ քայլ առաջ է անցել հետադարձ հղումների պարզ մաթեմատիկական գումարը ներկայացնող հղումների հանրաճանաչությունից (link popularity): Ըմբռնելով PageRank-ի իմաստը, դուք հասկացաք, որ բարձրացնելով Ձեր կայքի PageRank-ը՝ դուք բարձրացնում եք Ձեր կայքի արժեքը, մատչելիությունը Google-ում, եւ, ի վերջո, Ձեր կայքում Google-ի կամ կամ այլ գովազդի տեղադրման Ձեր սահմանած դրույքաչափը:
Կարծում ենք, եկել է ժամանակը, որպեսզի «բառերը» փոխակերպենք «բանաձեւի» եւ դիտարկենք, թե կոնկրետ ինչ ցուցանիշներից է կախված որեւէ էջի PageRank-ը: Անմիջապես
զգուշացնում ենք, որ Ձեզ ներկայացնող բանաձեւը երբեւէ չի հրապարակվել Google-ի կողմից, այլ ստացվել է մի քանի փորձագետների կողմից եւ կարող է օգտագործվել որպես PageRank-ի միայն մոտավոր արժեքը հաշվարկելու համար:
Սակայն, մենք համոզված ենք, որ Դուք դժվար թե անհրաժեշտ համարեք ներկայացվող բանաձեւի օգնությամբ հաշվարկել որեւէ էջի PageRank-ը. չէ՞ որ այս ցուիցանիշը ցուցադրվում է նույն Google վահանակի (Google Toolbar) վրա: Նաեւ, որեւէ որոնող համակարգի միջոցով եթե որոնեք «PageRank calculation» կամ համանման արտահայտություններ, ապա կարող եք գտնել տասնյակ եւ հարյուրավոր կայքեր, որոնք տրամադրում են PageRank-ի որոշման գործիքներ: Այսքանը գրելուց հետո, կարծում ենք, արդեն «ինքնագովազդ» չի համարվի մեր այն տեղեկատվությունը, որ նման առցանց գործիք ունենք նաեւ մենք. պարզապես այցելեք
«PageRank-ի գնահատում» էջը:
Ձեզ մոտ կարող է նաեւ բնական հարց առաջանալ, թե այդ դեպքում էլ ի՞նչ նշանակություն ունի PageRank-ի հաշվարկման բանաձեւին տեղեկանալը: Պատասխանը միակն է. մեզ պետք է հասկանալ բանաձեւի էությունը, եւ ոչ թե անգիր սովորել այն, իսկ մեկ անգամ հասկանալով այն, դուք կըմբռնեք նաեւ PageRank-ի «հմայքի գաղտնիքը»:
PageRank-ի հաշվարկման բանաձեւ. անվանում են նաեւ՝ Google PageRank algo (իմա՝ ալգորիթմ)
PR(Ա) = (1-d) + d(PR(t1)/C(t1) + ... + PR(tn)/C(tn))
Որտեղ.
PR(Ա) - Ա էջի PageRank
t1 ... tn - Ա էջին ուղղված հղում պարունակող «արտաքին» էջերն են (էջեր, որոնք չեն պարունակում A-ի կայքին): Նման հղումներն այլ կերպ անվանում են նաեւ
«բերող» (Inbound Links)
PR(t1) ... PR(tn) - Բերող հղումներ պարունակող արտաքին էջերի PageRank-երն են
C - Ա էջին «բերող հղում» ապահովող էջի՝ դեպի «արտաքին» այլ էջեր ուղղված հղումների քանակն է: Նման հղումներն այլ կերպ անվանում են նաեւ
«տանող» (Outbound Links)
d - կոչվում է դեմփինգ գործոն
Սովորաբար ընդունվում է, որ d=0.85, եւ PageRank-ի հաշվարկման վերոնշյալ բանաձեւը ստանում է հետեւյալ ավելի պարզ տեսքը.
PR(A) = 0.15 + (0.85)(PR(t1)/C(t1) + ... + PR(tn)/C(tn))
Ավելի ուշադիր դիտարկելով այս բանաձեւը, կարող ենք նկատել, որ որեւէ էջի PageRank-ը կազմվում է որպես այդ էջին «բերող» հղումներ ապահովող բոլոր էջերի PageRank-երի եւ այդ նույն էջերի «տանող» հղումների թվի հարաբերությունների գումար:
Դիտարկելով հետեւյալ պարզագույն օրինակը, կարծում ենք, վերոնշյալ բանաձեւը Ձեզ համար կկորցնի իր բարդությունը (եթե ուներ), իսկ դուք գործնականում կհասկանաք, թե ինչ գործոններից է կախված որեւէ էջի PageRank-ը:
Օրինակ. Մենք ցանկանում ենք հաշվարկել որեւէ երեւակայական կայքի շքամուտքի (սա մեր Ա էջն է) PageRank-ը: Այս Ա էջը պարունակում է 4 հատ «բերող» հղում՝ որոնք տեղադրված են 4 տարբեր կայքերի Բ, Գ, Դ եւ Ե էջերում:
• Բ էջի PageRank-ը 6 է, եւ այս էջը պարունակում է 10 հատ «տանող» հղում (համառոտագրելով՝ PR(Բ)=6; C(Բ)=10)
• PR(Գ)=6, C(Գ)=100
• PR(Դ)=1, C(Դ)=10
• PR(Ե)=1, C(Ե)=100
Այժմ եկեք տեսնենք, թե մեր Ա էջին հղում «բերող» Բ, Գ, Դ եւ Ե էջերից որն ինչ չափով է նպաստում Ա էջի PageRank-ի բարձրացմանը:
• Բ էջ. 6/10=0.6
• Գ էջ. 6/100=0.06
• Դ էջ. 1/10=0.1
• Ե էջ. 1/100=0.01
PR(Ա) = 0.15 + (0.85)(0.6 + 0.06 + 0.1 + 0.01) = 0.8045
Հիշեցնում ենք, որ սա ոչ ճշգրիտ հաշվարկ է, եւ այս հոդվածում ներկայացվում է միայն ուսուցողական նպատակով (իհարկե, հաճելի եւ շահավետ կլիներ իմանալ Google-ի բոլոր գաղտնիքները):
Այսպիսով, եկեք փաստենք PageRank-ի բանաձեւի դիտարկումից ստացած մեր
առաջին օգտակար դրույթը.
Որեւէ էջի PageRank-ի մեծությունը կախված է ոչ միայն այդ էջի հղումը պարունակող այլ կայքէջի PageRank-ից, այլ նաեւ վերջինիս «տանող» հղումների քանակից: Այս նույն հարցը կարող ենք դիտարկել հակառակ ուղղությամբ. յուրաքանչյուր էջ իր սահմաններում ընկած բոլոր «տանող» հղումների հետ այդ հղումների հաստեատեր-էջերին ուղարկում է միատեսակ՝ PR/C չափի «նպաստ» (share):
Ելնելով այս մտքից, PageRank-ի բանաձեւը կարող ենք դիտարկել նաեւ հետւեյալ հարթությամբ.
PR(A) = 0.15 + 0.85 (բոլոր «բերող» էջերի կողմից ուղարկած «նպաստ»-ների գումարը)
Եկեք առաջ շարժվենք եւ ձեւակերպենք PageRank-ի բանաձեւից ածանցվող
երկրորդ օգտակար միտքը.
Որեւէ էջի` «տանող» հղմանն ուղարկվող «նպաստի» չափսը ուղիղ համեմատական է այդ էջի PageRank-ին եւ հակադարձ համեմատական՝ այդ էջի բոլոր «տանող» հղումների թվին:
Սա նշանակում է, որ բարձր PageRank ունեցող որեւէ էջում մեր կայքի էջերից որեւէ մեկի հղումը տեսնելուց կարելի է ուրախանալ, սակայն՝ վատ չէր լինի զննել այդ էջը վերեւից-ներքեւ եւ հաշվել, թե մեր կայքէջի հղումից բացի քանի՞ հատ նման «տանող» հղում է պարունակում այդ էջը: Միգուցե 100 հա՞տ, ինչպես մեր օրինակի Գ էջի դեպքում էր: Այս դեպքում, նույնիսկ եթե այդ էջը ուներ PR=6, ապա մեր «նպաստն» այդ «հզոր» էջից կազմել է միայն 6/100=0.06, (որն էլ բազմապատկվելով 0.85-ի հետ, կկազմի ինչ-որ չնչին թիվ՝ 0.051, որն այդ էջի՝ մեր PageRank-ին շնորհած բացարձակ չափն է):
Կարծես թե մենք արդեն քննարկեցինք որեւէ էջի PageRank-ի ձեւավորման երկու հիմնական բաղադրիչները՝ «բերող» հղման «որակը» կամ, ինչպես Google-ն է ակնարկում, «կարեւորությունը»՝ ի դեմս PageRank-ի, եւ «բերող» հղման «նպաստի» չափսը՝ ի դեմս բերող էջում պարունակվող «տանող» հղումների քանակի: Կարծես թե վերջ, այդպես չէ՞: Թեեւ, մենք բաց ենք թողել բանաձեւի մի կարեւոր հատված: Ո՛չ, խոսքը 0.15-ի կամ 0.85-ի մասին չէ. այս երկուսն էլ հաստատուն «անկախ» թվեր են: Խոսքը բազմակետի մասին է, այսինքն՝ n թվի, որը ցույց էր տալիս դեպի մեր կայքէջ «բերող» հղումների քանակը: Մի պարբերություն վերեւ մենք Ձեզ քիչ հուսահատացրեցինք, թե ինչպիսի չնչին ազդեցություն կարող է թողնել մեր կայքէջի PageRank-ի բարձրացման վրա 100 հատ «տանող» հղում պարունակող նույնիսկ PR=6-անոց էջը: (Էլ չենք ասում այն ուղեցույցների մասին, որոնք ընդհանրապես PageRank չունեն, իսկ մեր հղումը ներառող էջը պարունակում է… եւս 40-50 հատ այլ կայքերի հղումներ):
Սակայն, վհատվել պետք չէ, պետք է միայն գործել: Այն էլ՝ խելամիտ կերպով (ինչպես հնչում էր «Եռանկյունի» կինոնկարում՝ պետք է գիտությամբ չալել): Մեր լուծումներից մեկը հենց այն է, որ մենք կարող ենք ունենալ հարյուրավոր փոքրիկ «նպաստներ», որոնք ի վերջո կարող են բարձրացնել մեր կայքէջի PageRank-ը: Մենք կարող ենք մեծացնել n-ը: Մեծացնելով «բերող» հղումների թիվը՝ մենք կնպաստենք մեր կայքէջի PageRank-ի աճին: Ահա Ձեզ PageRank-ի բանաձեւից ածանցվող եւս մեկ՝ արդեն
երկրորդ օգտակար միտքը:
Կարծում ենք՝ սկզբի համար այսքանը բավական է: Մի պայմանով՝ որ Ձեր մեկնաբանություններում դուք կառաջարկեք նոր եզրահանգումներ եւ նոր առաջարկություններ՝ ուղղված կայքէջի PageRank-ի բարձրացմանը:
Ծանոթություն
* PageRank անվանման «Page»-ը իրենից ներկայացնում է այս համակարգի հեղինակ Larry Page-ի ազգանունը: