Aide pour la compréhension d'une formule du PageRank

Retrouver tous les sujets résolus.
Répondre
PageRank

Aide pour la compréhension d'une formule du PageRank

Message par PageRank » sam. 31 janv. 2015 18:37

Bonsoir,
J'effectue actuellement des recherches sur l'algorithme de classement des résultats du moteur de recherche Google, le PageRank, mais je me retrouve coincé par mes pauvres connaissances d'élève de première S.

Voici la formule en question, ainsi que l'énoncé de la chose (en anglais malheureusement):

Let u be a web page. Then let \(F_{u}\) be the set of pages u points to and \(B_{u}\) be the set of pages that point to u. Let \(N_{u} = |F_{u}|\) be the number of links from u and let c be a factor used for normalization.
Stated another way. Let A be a square matrix with the rows and column corresponding to web pages. Let \(A_{u,v} = \frac{1}{N_{u}}\) if there is an edge from u to v and \(A_{u,v} = 0\) if not. If we treat R as a vector over web pages, then we have R = cAR. So R is an eigenvector of A with eigenvalue c. In fact, we want the dominant eigenvector of A. It may be computed by repeatedly applying A to any nondegenerate start vector.
There is a small problem with this simplied ranking function. Consider two web pages that point to each other but to no other page. And suppose there is some web page which points to one of them. Then, during iteration, this loop will accumulate rank but never distribute any rank, since there are no outedges. The loop forms a sort of trap which we call a rank sink.
To overcome this problem of rank sinks, we intro duce a rank source:

Let E(u) be some vector over the Web pages that corresponds to a source of rank. Then, the PageRank of a set of Web pages is an assignment, R', to the Web pages which satisfies

\(R'(u) = c * \sum_{v \in B_{u}}^{} {\frac{R'(v)}{N_{v}}} + c * E(u)\)

Such that \(\||R'\||_{1} = 1\).

Je connais le principe des vecteurs propres, mais seulement le principe. Ce que je ne comprends pas, c'est le fonctionnement même de la formule. La somme ne me pose pas de problèmes en soi. En fait, je comprends la formule d'un point de vue purement algébrique, mais j'ai du mal à imaginer ce que peut signifier en soi "R as a vector over web pages", et ce qu'il en découle.

En vous remerciant par avance pour votre aide,
Bonne soirée.
SoS-Math(9)
Messages : 6351
Enregistré le : mer. 5 sept. 2007 12:10

Re: Aide pour la compréhension d'une formule du PageRank

Message par SoS-Math(9) » sam. 31 janv. 2015 19:20

Bonsoir,

Je suis désolé mais je ne peux pas vous aider.

SoSMath.
PageRank

Re: Aide pour la compréhension d'une formule du PageRank

Message par PageRank » sam. 31 janv. 2015 19:49

Merci d'avoir pris le temps de me répondre, même si je sais bien que ce genre de demandes dépasse très largement le cadre du programme de lycée.

Néanmoins, auriez-vous le lien d'un forum où je serai plus susceptible d'obtenir une réponse ?

Bonne soirée à vous.
SoS-Math(9)
Messages : 6351
Enregistré le : mer. 5 sept. 2007 12:10

Re: Aide pour la compréhension d'une formule du PageRank

Message par SoS-Math(9) » sam. 31 janv. 2015 20:20

Bonsoir,

je n'ai pas site précis à vous proposer, mais si vous taper dans un moteur de recherche "formule PageRank", vous trouverez des liens ...

SoSMath.
PageRank

Re: Aide pour la compréhension d'une formule du PageRank

Message par PageRank » sam. 31 janv. 2015 20:32

Je vous remercie pour votre réponse, mais j'ai déjà à ma disposition un nombre extrêmement important de pages web ou de documents PDF relatifs au PageRank. Mon besoin en soi est de comprendre ce qui découle réellement de la notion de vecteur propre incluse dans la formule, qui peut se trouver d'ailleurs sous une forme incomplète, mais purement algébrique.
On trouve sans problème des explications de la version appliquée de la formule, mais ce n'est pas ce qui m'intéresse réellement.

Car même après la lecture de plusieurs cours et documents sur les valeurs propres et les vecteurs propres, je peine toujours à saisir leur importance dans la formule.

Bonne soirée.
sos-math(27)
Messages : 1427
Enregistré le : ven. 20 juin 2014 15:58

Re: Aide pour la compréhension d'une formule du PageRank

Message par sos-math(27) » dim. 1 févr. 2015 09:46

Bonjour,

Pour ma part, si vous avez pu prendre connaissance de cours sur la notion de pagerank, et les comprendre, nous en sommes au même niveau. Il faut vous tourner vers d'autres forum.
Je pense aussi que le fameux algorithme de Google relève du secret industriel, et donc les informations diffusée à son propos ne sont pas complètes. (ce n'est qu'une opinion)

Désolée de ne pouvoir vous répondre de façon plus complète.
A bientôt
Répondre