gM
Retour / Back 
Recherche Internet / Internet Search



This page is written in French; if you're interested in it and wish my translating into English, do ask me!

Les moteurs de recherche / Search Engines <-  
En quête de pertinence / In Search of Pertinence <-  
  -> Recherche de personnes / People Search
  -> Les portails / Portals
-> Référencement / Referencing <-



  -> Les moteurs de recherche / Search Engines
  Annuaires, moteurs, métamoteurs... / Directories, engines, meta-engines...
 
Annuaires de moteurs de recherche ->
/ Web Engine Directories ->
fravia.com
abondance.com : toute l'actualité des moteurs du Web / News regarding Web engines
enfin.com : annuaire des moteurs de recherche francophones / Directory of French-speaking search engines
UC Berkeley Library
  Annuaire Bourdet   Albert MoteurOnLine   ApocalX Metaguide
  Troovle Webootik   Web-Annu
Les majors...
 
Organisme Adresse Type Accès Commentaires





AlltheWeb alltheweb.com Moteur - 2,1 milliards de pages en juin 2002
___
AltaVista altavista.fr Moteur Avancé 2 entrées suivant la langue et la localisation, Guide de recherche en ligne
___
Ariane 6 ariane6.com Métamoteur - On paramètre ses propres moteurs
___
Ask Jeeves askjeeves.com - - -
___
Copernic copernic.com Métamoteur Simple Téléchargement gratuit, 85 moteurs & 8 domaines
___
Echo echo.fr - - -
___
Exalead exalead.com Moteur - Analyse linguistique ; création automatique d'un mini-annuaire ; 50 m.pages web
___
Excite excite.com Moteur - -
___
Francité francite.com - - -
___
Google google.com Moteur Simple popularité ; Recherche Google ; 2 milliards de pages
___
HotBot hotbot.fr Moteur
___
Human Links Human Links - - peer-to-peer
___
iLor ilor.com Moteur - -
___
Infoseek infoseek.com Moteur - -
___
Ixquick ixquick.com Métamoteur - -
___
Kartoo kartoo.com Moteur Cartographie du Web
___
Looksmart looksmart.fr Annuaire - se retrouve sur des portails
___
Lycos lycos.fr Annuaire Avancé Moteur de recherche à l'origine, il est devenu un guide Internet
___
MetaCrawler metacrawler.com Métamoteur - -
___
MSN msn.fr Moteur & Annuaire Avancé Moteur + Annuaire + Questions en ligne (MicroSoft)
___
Nomade nomade.fr - - -
___
Northern Light northernlight.com Moteur - -
___
ProFusion profusion.com Métamoteur - -
___
SurfWax surfwax.com Métamoteur - -
___
Teoma teoma.com Moteur & Annuaire - fonction Refine ; 200 m.pages
(racheté par Ask Jeeves en avril 2002)
___
Voilà voila.fr Moteur & Annuaire Simple Moteur + Annuaire + Recherche thématique (France Télécom)
___
WebCrawler webcrawler.com Moteur - -
___
Wisenut wisenut.com Moteur   Un sérieux challenger pour Google
___
Yahoo! yahoo.fr Annuaire Simple Une star ; contenu indépendant du site .com & Google

Et d'autres...    Enfin Trouver    Wondir    Etula    Killer Info    La Toile du Québec

 
Top of page  



  -> En quête de pertinence / In Search of Pertinence
(inspiré de Sciences & Avenir n°652 Juin 2001 p.120 par David Groison)

Avec plusieurs milliards de pages Web, les moteurs de recherche sont en recherche permanente d'efficacité...

Indexation et mots clés - Un moteur de recherche, c'est un site particulier, censé nous guider dans les 2 ou 3 milliards de pages disponibles sur Internet. Pour cela, un robot parcourt en permanence le réseau et archive le contenu des pages qu'il rencontre. Il note les termes qui composent chacune d'entre elles et retient les plus significatifs : les mots clés. Ensuite, la sélection est inversée pour garder en mémoire un index ou chaque mot clé est associé à une suite de pages qui le contiennent. Par exemple, sur le moteur de recherche Google, le terme "MP3", est ainsi associé à plus de 13 millions de pages. Cette liste est ensuite proposée à l'internaute lorsqu'il tape un ou plusieurs mots pour définir sa requête. S'il tape "MP3", il pourra ainsi cliquer sur une des 13 millions de pages qui lui sont proposées. Bon courage ! Pour économiser du temps, il ne lui reste qu'une solution : mieux définir sa recherche.
Recherche multicritère et opérateurs - Pourtant, peu d'internautes s'y attellent. Selon des études de la société MSN, 95 % des requêtes effectuées sur le Web ne contiennent en effet qu'un seul terme. Chercheur à l'université Penn State, aux Etats-Unis, Amanda Spink s'est penchée sur le comportement des utilisateurs des moteurs de recherche. "Seuls 5 % d'entre eux sont à l'aise avec les options de recherche avancées, comme les opérateurs booléens ("et", "ou"...), les guillemets et les parenthèses", note-t-elle. Ainsi, les scientifiques ont beau développer des méthodes de recherche très puissantes, si les outils pour les utiliser ne sont pas automatiques, il y a peu de chances que les internautes les utilisent. Les responsables du moteur Google l'ont compris avant les autres. Pour eux, quand un internaute tape 2 mots dans un moteur de recherche, c'est qu'il souhaite implicitement que les 2 figurent dans les documents qu'il cherche ("et"), et non l'un ou l'autre ("ou"). C'est donc ce principe qu'ils ont intégré par défaut dans leur moteur de recherche, avant d'être repris par Voila et MSN.
Interface et recherche avancée - De façon plus générale, pour être efficaces, les moteurs doivent privilégier les interfaces simples et intuitives. De nombreux moteurs proposent ainsi des formules pour des questions pointues, avec des cases à cocher ou des menus déroulants. C'est le cas d'Altavista. Lors d'une recherche sur les Beatles, le moteur demande de limiter la sélection aux fichiers MP3, aux paroles, aux photos, aux partitions, etc. Un terme ou deux à cocher, ce n'est pas compliqué et çà rend la recherche bien plus pertinente. Sur le même principe, le nouveau moteur de recherche Kartoo.com, propose une sorte de cartographie du Web. L'internaute commence par saisir un mot clé, et le moteur en propose d'autres sous forme d'un graphique pour lui permettre d'affiner la recherche. En tapant "effet de serre", le moteur dessine différentes branches où figurent les termes "ville", "gaz", "océan", "écologie". En passant, de branche en branche, on élimine les documents hors sujet.
Pertinence des résultats - Pour tous les moteurs, une fois les mots clés saisis, une fois la recherche affinée, des adresses de sites s'affichent sur l'écran. Des centaines d'adresses. Pourtant, 90 % des utilisateurs ne vont pas au-delà de la deuxième page de résultats. Il est donc indispensable de trouver un maximum de résultats pertinents dés les premières réponses. Pour présenter le palmarès idéal, certains moteurs affichent ainsi en priorité les sites les plus populaires, ceux qui contiennent outre du texte, des hyperliens et des adresses pointant vers d'autres sites. "Dans l'ensemble, les hyperliens sont une marque d'adhésion et confèrent aux sites un statut de référence", affirme Ravi Kumar. Ce chercheur chez IBM sépare le Web en 2 parties. "Il y a les pages qui font autorité et celles qui servent de pivot. Les premières sont les meilleures sources d'informations sur un sujet précis, les secondes sont des groupes de liens, au contenu voisin, qui pointent vers les premières." Deux anciens étudiants de l'université de Stanford, aux Etats-Unis, l'ont bien compris. A côté de leur laboratoire, ils ont fondé leur entreprise et sur cette idée, ont lancé leur moteur de recherche, Google. "Si les sites sont populaires, c'est qu'ils doivent apporter des informations pertinentes", pensent-ils. C'est souvent vrai et c'est la force de leur moteur. Mais ce postulat écarte les sites plus marginaux, ceux vers qui personne ne pointe. Google donne ainsi une prime aux positions dominantes et n'offre qu'avec retard un espace aux nouveaux venus. Pourtant, "tout le monde a suivi. Les moteurs de recherche ont tous intégré un indice de popularité", commente Olivier Andrieu, consultant spécialiste des moteurs de recherche. Mais ce n'est pour ces derniers qu'un critère parmi d'autres. Car les moteurs de recherche réalisent principalement leur classement en notant la présence des mots clés dans le titre ou le premier paragraphe, leur fréquence ou leur proximité dans le texte.
Associations de mots clés - A côté de la popularité, d'autres moteurs utilisent différentes astuces de présentation. Quand il trouve une photo ou une illustration significative sur un des sites qu'il trouve, Altavista l'affiche à côté de l'adresse du site et d'une liste des mots trouvés à l'intérieur du document. Si le mot clé tapé pour la recherche était "vélo", voir apparaître les termes "location", "tour de France", "pollution" ou "achat" permet à l'internaute de faire un premier tri. De nombreux moteurs possèdent maintenant une telle fonction.
Autres formats et Web inaccessible - Mais ces astuces ne suffisent pas. Peu importe les images et les mots surlignés si les informations proposées ne sont pas celles recherchées. Pour trouver à coup sûr les bons documents, les moteurs de recherche doivent améliorer de nombreux points. La taille du corpus tout d'abord. On reproche en effet aux moteurs de n'indexer qu'une petite partie du Web, entre 10 à 15 % de la toile mondiale. Mais les moteurs réalisent là de vrais progrès. Google intègre désormais les pages au format PDF, correspondant souvent aux communications scientifiques, aux actes des colloques, aux publications des chercheurs du monde entier. Riches d'informations, ces articles apportent un vrai plus pour une recherche précise, pour une recherche de spécialiste. Altavista, de son côté, veut intégrer les bases de données des sites dynamiques, ces pages au contenu sans cesse réactualisé. En clair : le catalogue de la FNAC ou celui d'Amazon, les reportages du site de TF1 ou de Radio-France. La société a déjà conclu des accords aux Etats-Unis offrant ainsi un accès aux derniers reportages de CNN sur George W. Bush ou Brad Pitt. "En France, technologiquement, nous sommes prêts. Il reste à conclure des accords avec des sites d'actualité ou de petites annonces", commente Cyrille Franck, responsable d'Altavista pour l'Hexagone.
Fraîcheur de l'information - On touche ici à l'autre grand problème des moteurs de recherche : trouver les pages les plus fraîches, le dernier reportage vidéo ou la dernière promotion. Peu importe la météo d'hier, c'est celle d'aujourd'hui qui compte ! Pour les informations pratiques, rapidement désuètes, utiliser un annuaire est donc préférable. Un annuaire, c'est un moteur de recherche indexé à la main, non par des robots mais par gens en chair et en os qui répertorient les sites, catégorie par catégorie. Mais les annuaires sont limités : comment mettre à jour toutes les listes de réponses prédéfinies alors que le nombre de pages croît au rythme d'un million par jour ? Sur l'annuaire Yahoo!, seuls 120 000 sites sont recensés, tandis que le moteur Google recherche sur plus d'un milliard de pages. "La vraie tendance est au mélange", observe Olivier Andrieu. Des sites de recherche à la fois moteurs et annuaires, à la fois automatiques et humains, qui renvoient d'abord des adresses de sites, ensuite des adresses de pages. "On essaie d'avoir un outil complet avec un annuaire qui propose un choix éditorial, des dépêches de l'AFP pour avoir les dernières infos, l'encyclopédie de Hachette pour les recherches de fond, et un moteur pour ne rien oublier", se félicite Pierre Geret, directeur de Voila.
Fraîcheur encore... - Mais les moteurs de recherche n'ont pas tous besoin de multiplier les entrées pour être à la page ! Le moteur de recherche Altavista met à jour son contenu en 15 jours. Pour certaines requêtes, cela peut suffire. Avec HotBot, les documents sont présentés en fonction de leur date de mise à jour. Si on veut les dernières infos, c'est le moteur idéal. Certains moteurs utilisent aussi l'actualité pour pondérer les résultats. En février, si un internaute saisit le terme "impôt", c'est qu'il cherche sûrement des informations pour remplir sa déclaration de revenus. En septembre, c'est qu'il doit les payer. A un même mot correspond finalement une requête différente. C'est une autre façon de jouer sur la fraîcheur de l'information.
Devoir de mémoire - D'un autre côté, si les moteurs de recherche doivent répertorier les dernières mises à jour, ils ne doivent pas pour autant effacer les versions plus anciennes. Les moteurs possèdent un devoir de mémoire qu'ils ne respectent pas toujours : il n'est pas rare lors d'une recherche, de tomber sur des liens morts, des pages ayant disparu. Google conserve lui une trace de toutes les pages qu'il a mémorisées. Mais il est un des seuls.
Prospective - Ce souci de mémoire permettra peut-être d'archiver les moteurs de recherche d'aujourd'hui... Pour les montrer aux générations futures qui découvriront, amusées, ces vestiges du passé. Là est peut-être la vraie tendance : rendre les moteurs de recherche transparents. Yahoo! propose Yahoo!Compagnon, une barre d'outils à télécharger qui vient se loger sous les fonctions de navigation proposées par Internet Explorer ou Netscape Navigator. Plus besoin d'ouvrir une nouvelle fenêtre pour effectuer sa recherche. On tape sa requête dans la barre et les résultats s'affichent dans la fenêtre ouverte. De son côté, Altavista propose d'ajouter une icône dans la barre de liens. Quel que soit le site où l'on se trouve, il est possible de sélectionner ensuite un mot pour accéder directement à la page de résultats. Dans ce cas, le moteur est en quelque sorte intégré au navigateur. En attendant, demain sans doute, qu'il soit intégré au traitement de texte. Il suffira alors, au milieu d'un paragraphe, de taper ou de surligner un mot pour en savoir plus. Le Net sera devenu ainsi de qu'il devrait être depuis longtemps : une porte toujours ouverte sur la connaissance.
-> Affiner la pertinence des réponses
-> Faciliter la consultation des résultats
-> Bénéficier des connaissances des autres
Top of page  



  -> Recherche de personnes / People Search
Là où ça pèche encore, c'est sur les recherches de numéros de téléphones mobiles. Aujourd'hui, il faut connaître l'opérateur de la personne qu'on cherche si on veut avoir une chance de la retrouver. Pas évident. Mais ça devrait bientôt changer grâce au très attendu annuaire universel. Une directive de Bruxelles de 1996, a institué l'élaboration d'un annuaire universel et la déréglementation des télécoms.
Téléphone :
  Le 12, c'est cher avec ses 0,80 €/2 rech.
  Pages Jaunes (pages blanches et jaunes, annuaire de mails, rues, sites Web, annuaire des grands opérateurs mondiaux)
  Gratissimo (annuaire)
  Comparetel.fr   /   Budgetelecom.com
  koo2fil.com
(international)
  Infobel   /   eu-info.com
  AnyWho Internet Directory Assistance   /   International White and Yellow Pages
  societe.com   /   Scoot.fr (contact professionnel)
(mobiles)
  0800 10 10 33 - France Télécom a ouvert un numéro vert pour qui veut inscrire volontairement son numéro de portable dans un annuaire dédié.
  ou 222 chez SFR à 0,84 €/appel, 712 chez Orange à 0,85 €/appel, 612 chez Bouygues à 0,84 €/appel)
  Pages Mobiles
(annuaires inversés)
  ctqui.fr   /   quitelephone.com
  quidonc.fr (-0,50 €/appel)
Trouver un ami en ligne - Tapez son pseudo dans le carnet d'adresse des outils de messagerie instantanée (MSN Messenger, AIM, ICQ...)
Le traqueur d'e-mails - Sur Visual Route, eMailTrakerPro retrouvez l'adresse IP de ceux qui vous envoient des mails indésirables.
E-mails -
1- Faites appel aux différents annuaires de votre logiciel de messagerie, par exemple Outlok Express/Carnet d'adresses/bouton Rechercher des personnes (recherche dans les annuaires BigFoot, Verisign, etc.)
2- Utilisez la recherche avancée.
3- Passez à un moteur généraliste comme Google.
4- Exploitez les sites d'entreprise, d'universités et de lycées, comme Louis-Le-Grand.
Vérifier une adresse e-mail :
  AltaVista Find a Person - Search
  InfoSpace
  Internet Address Finder -Email Directory
  Lokace E-Mail
  Switchboard.Find a Person -Search
  WhoWhere
  Yahoo! People Search
  Annuaire-etudiants.net
  HotBot -Email Addresses
  infoUSA.com - American Directory Assistance - Find A Person
  La Poste
  Netscape People Finder
  Vérification d'adresses électroniques-Email checking
  WhoWhere
  Detective Mail
  Annuaire-email.net
  AnEmLi
Trouver quelqu'un dans un forum -
-1-se connecter à Google.fr. Le moteur de recherche Google a racheté la base DejaNews, qui compile bon nombre de forums de discussion présents sur le Web (Usenet).
-2-Lancer la recherche dans "Groupes". Google propose de lancer une recherche sur un nom dans les groupes de discussion en .fr, puis par thème, ou dans tous les groupes.
-3-Découvrez les messages. Quelque peu indiscret, mais pratique, vous allez découvrir les messages laissés dans les forums par la personne recherchée. Vous trouverez vite son e-mail.
Trouver quelqu'un par son nom de domaine -
-1-Se connecter sur Whois. Et si la personne cherchée avait acheté son nom de domaine ? Vérifier sur la base Whois. Elle recense l'ensemble des noms de domaines du Web. On la trouve sur whois.net et sur différents sites d'enregistrement comme gandi.net ou //combat.uxn.com.
-2-Vérifier si le nom de domaine existe. Sur Gandi.net, tapez le nom d'une connaissance suivi de .com, .net, .org ou .info. Par exemple, dupont.com. Vous saurez vite s'il a déposé ou non un nom de domaine. Dans l'affirmative, la base de données Whois vous en dira plus.
-3-Accéder à toutes les coordonnées. Whois livre l'adresse, le téléphone, le fax et l'e-mail de l'administrateur propriétaire du nom de domaine. Si la recherche n'aboutit pas, vérifiez si votre ami n'a pas créé une page perso. Pour cela, consultez les annuaires de pages perso des FAI.
  NameSearch Google
  INTERNIC.COM
  NSI - WHOIS Lookup
  Whois (NIC France)
  Network Solutions
  Query the RIPE Whois Database
  Internet Assigned Numbers Authority
  DNSstuff.com
  Eurnet Whois
  CASpam -whois
  Geektools
  BBoxBBS
Les Services de la Communauté Scolaire de Saint-Benoît -
  NSLookUp
  Ping IPv4 Gateway
  Ping IPv6 Gateway
  WHOIS Gateway (13 DNS)
  TraceRoute IPv4 Gateway
  TraceRoute IPv6 Gateway
  Looking Glass
  TracePath IPv4 Gateway
  TracePath IPv6 Gateway
Top of page  



  -> Les portails / Portals
Top of page  



  -> Référencement / Referencing   forum CCM-205077
Référencement Web selon Webmasterplan.com
Référencement Google
Sites de référencement Web
Sites de popularité Web
Les balises META
Retour / Back   Top of page