Bonne année 2005
On vous souhaite bonheur, santé et prospérité pour la nouvelle année.
Fils web contre sites web
Excellent article : "The Role of RSS in Science Publishing" (découvert grâce à Rémolino).
L'intro, particulièrement, fait preuve d'une bonne concision pour ce qui est de signaler la révolution Internet en cours:
"[...] Tim Berners-Lee's original conception of the Web was much more of a shared collaboratory than the flat, read-only kaleidoscope that has subsequently emerged: a consumer wonderland, rather than a common cooperative workspace. Where did it all go wrong?"
La bulle Internet, cette irrationnelle vente pyramidale qui a ébranlé l'économie mondiale (et siphoné nos fonds de retraite), a marqué la fin de l'assaut commerciale des vautours financiers, préoccupés qu'il étaient à détourner le réseau des réseaux en immense centre d'achat. Cet incroyable revers de l'impitoyable machine capitaliste démontre qu'Internet reste encore un espace où une autre façon de faire les choses est possible.
Le RSS comme antithèse des sites web
"[...] new 'disruptive' technologies are now beginning to challenge the orthodoxy of the traditional website and its primacy in users' minds. The bastion of online publishing is under threat as never before. RSS is the very antithesis of the website. It is not a 'home page' for visitors to call at, but rather it provides a synopsis, or snapshot, of the current state of a website with simple titles and links. While titles and links are the joints that articulate an RSS feed, they can be freely embellished with textual descriptions and richer metadata annotations.
Thus said, RSS usually functions as a signal of change on a distant website, but it can more generally be interpreted as a kind of network connector—or glue technology—between disparate applications. Syndication and annotation are the order of the day and are beginning to herald a new immediacy in communications and information provision. "
Comprendre le RSS n'est pas si difficile en soi. Voir les opportunités ou les mettre en pratique, demande plus de flaire... Le web tel qu'on le connaît n'est qu'une transposition des "pages papiers" (l'effet diligence dont je faisais mention plus tôt ce mois-ci). L'espace web n'avait qu'une dimension : la page ponctuelle, en attente d'être trouvée. Le RSS donne une dimension supplémentaire et permet de faire circuler l'information le long d'un fil afin de se rendre à un endroit plus appropriée.
"RSS is one of a new breed of technologies that is contributing to the ever-expanding dominance of the Web as the pre-eminent, global information medium. It is intimately connected with—though not bound to—social environments such as blogs and wikis, annotation tools such as del.icio.us, Flickr and Furl, and more recent hybrid utilities such as JotSpot , which are reshaping and redefining our view of the Web that has been built up and sustained over the last 10 years and more."Il est clair que l'acronyme RSS ne sera pas connu du grand public (du moins pas plus que HTML), mais le concept de Fil Web ou Abonnement Web le sera. Le blog sera le premier cheval de Troie pour faire utiliser cette technologie par le grand public.
Urchin, l'agrégateur libre
Le document, ensuite, explique en détail l'avantage du RSS 1.0 sur le RSS 2.0 et Atom. Il s'étend ensuite sur Urchin, l'agrégateur RSS qui me semble une formidable machine à inférence. (Ça me rappelle des ébauches élaborées pour une machine de croisements avec Sylvain Carle )
" The basic functionality of Urchin is to ingest information from a variety of data sources (including all flavours of RSS and Atom as well as screen-scraped HTML pages and even databases), to store that information internally and to emit on request a filtered information set expressed in a selected presentation format."En clair : son but est de générer des fils webs sur simple requête à sa base de données.
- Il me semble que nous avons là le début d'une alternative au "serveur de pages web" et qu'un "serveur de fils" sera prochainement l'outil le plus demandé dans le cahier des charges des futures refontes de sites Internet...
Lectures de 2004
(#ideologie)
DE L’IDÉOLOGIE AUJOURD'HUI - Analyses, parfois désobligeantes, du « discours » médiatico-publicitaire. François Brune - éditions Parangon, 2004, 192p.
L’idéologie ambiante se donne l’apparence d’une simple réalité indéniable, unique et objective, de l’ordre des choses, et mène inexorablement à la pensée unique. Elle dissimule la complexité du monde plutôt qu'elle ne le révèle.
François Brune, comme Guy Debord dans "Le monde du spectacle" il y a 30 ans, mais avec des mots clairs et précis, déscilleront les yeux à tous ceux qui pensent encore que nous vivons une "époque formidable". Take the red pill et lisez ce livre.
"Effet de sélection du réel par le choix de l’image, qui occulte tout ce qui est hors champ ; traitement journalistique qui fait mine de constater ce qu’il contribue largement à mettre en scène ; mythe du « progrès » qui nourrit une peur perpétuelle du « retard » ; métaphores biologiques et appels à la nature qui transforment des choix politiques en évolutions « naturelles » ; emprunts aux champs lexicaux sportif ou économique qui légitiment la logique de la compétition perpétuelle ; oxymores hypocrites, qui feignent de conjurer les rapports de force ; rhétorique publicitaire, qui occulte les conditions de production des marchandises (et les conditions de vie de ceux qui la produise), comme l’information objective sur les qualités et l’intérêt du produit ..." (Arnaud Rindel)
Liens utiles:
- QuiEst François Brune
- Résumés du livre (75, 162, 217 mots)
- Chapitre "Images (publicitaires) : le bonheur est dans l'illusion" disponible en ligne.
- Article sur le Dysfonctionnement dans le Monde Diplomatique
- Extrait sonore sur la Pub, vecteur de l'idélogie (MP3) (vous aurez un bon aperçu de sa philosophie)
(#media)
LES MÉDIAS PENSENT COMME MOI - Fragments du discours anonyme. François Brune. L'Harmattan, 1997 • 173 p.
"L'individu moderne est dépossédé de lui-même par les médias. Un vaste discours anonyme parasite chaque jour sa pensée et sa parole. Il croit avoir des idées, et il ne fait que répéter les clichés à la mode. Il croit exprimer, et ses lèvres récitent les formules de tout le monde. Or, ce discours n'est pas neutre. Il forme une véritable idéologie, dont la finalité semble claire : dépersonnaliser le citoyen pour le soumettre aux impératifs de l'ordre socio-économique."
Des milliers de phrases anonymes, dans les médias ou ailleurs, conditionnent chaque jour notre pensée et tout en feignant nous montrer l'état des choses la cache. "Être de son époque", pour mieux convaincre que vous ne pouvez changer les choses. "Réalisez votre bonheur", fuyez la réalité avec des modèles de réussite anonyme qu'il faut adopter pour devenir vous-même. "Le juste prix", vérité morale et conformité fonctionnelle, enlève l'arbitraire au "prix" pour justifier qu'il ne peut être remis en question (pensons au débât en cours sur le coût de l'électricité au Québec).
François Brune dissèque le discours ambiant repris dans nos sociétés de masses contemporaines comme Roland Barthes le faisait il y a 50 ans dans Mythologie pour la classe bourgoise. Un préalable indispensable au développement d'une parole personnelle.
Liens utiles:
- QuiEst François Brune
- "Les médias donnent à l'opinion un réel présélectionné"
- La Société des Mangeurs (Pour comprendre comment une expression descriptive devient prescriptive)
- Extrait : "Violence de l'idéologie publicitaire"
(#diamond)
GUNS, GERMS, AND STEEL - The Fates of Human Societies. Jared Diamond. Penguin, 1999, 480 p.
Pourquoi est-ce les Européens qui ont dominé la planète? Jared démontre point par point comment la géographie a pu façonner le destin humain, comment expliquer que l'histoire des Hommes ait pu différer d'un continent à l'autre. Il n'est nullement question de race, seulement d'environnement...
"History followed different courses for different peoples because of differences among peoples' environments, not because of biological differences among peoples themselves."
Les peuples qui ont dominé les plantes et les animaux plus tôt ont pu ensuite développer plus rapidement l'écriture, les gouvernements, la technologies, les engins de guerre et ... l'immunité aux maladies...
"We've identified a series of proximate factors behind European colonization of the New World: namely, ships, political organization, and writing that brought Europeans to the New World; European germs that killed most Indians before they could reach the battlefield; and guns, steel swords, and horses that gave Europeans a big advantage on the battlefield. Now, let's try to push the chain of causation back further. Why did these proximate advantages go to the Old World rather than to the New World? Theoretically, Native Americans might have been the ones to develop steel swords and guns first, to develop oceangoing ships and empires and writing first, to be mounted on domestic animals more terrifying than horses, and to bear germs worse than smallpox."
Ici vous trouverez un bon aperçu du livre ici : "Why Did Human History Unfold Differently On Different Continents For The Last 13,000 Years?"
"Winner of the Pulitzer Prize, the Phi Beta Kappa Award in Science, the Rhone-Poulenc Prize, and the Commonwealth club of California's Gold Medal".
(#cybernetique)
L'EMPIRE CYBERNÉTIQUE - Des machines à penser à la pensée machine. Céline Lafontaine. Seuil, 2004, 235 p.
Ce livre m'a fait comprendre jusqu'à quel point la pensée intellectuelle des cinquante dernières années a été influencé par la cybernétique et qu'elle tend à s'opposer à l'héritage humanisme de la modernité.
Le caractère apolitique et antihumain du culte unificateur de la technologie montre qu'en assimilant le fonctionnement du cerveau à celui d’un ordinateur, on suppose implicitement l’idée que toute forme de hiérarchie entre l’homme et la machine se dissipe ou même se renverse en faveur de cette dernière. La cybernétique est la «science du contrôle et de la communication» et présuppose que tout comportement (humain ou non humain) s'explique fonctionnellement par rapport à un but (sa finalité).
La subjectivité du sujet autonome n'est plus que le résultat d'une interaction informationnelle avec son environnement (un support d'informations) et qu'on s'illusionne à penser le contraire (la machine n'ayant pas cette tare).
(Ce n'est pas sans rappeller la teneur du débât que j'ai tenue plutôt cet été sur l'intelligence artificielle. )
On devine que l'auteure se fait très critique face à cette mouvance, mais on est surpris de ne pas la voir expliquer davantage cet humanisme mourrant dont elle se réclame. Il faut tout de même reconnaître qu'elle a eu le mérite enfin de replacer historiquement en contexte le structuralisme, la post-modernité et le déconstructivisme. Il fallait l'oser : retrouver dans la pensée européenne des traces de filiation avec celle typiquement américaine de la cybernétique.
(#logique)
LA LOGIQUE ET LE QUOTIDIEN - Une analyse dialogique des mécanismes d'argumentation. Gilbert Dispaux. Les éditions de minuit, 1984, 188 p.
Livre trouvé par hasard dans ma bibliothèque à l'occasion d'un chamboulement causé par mon petit Arnaud. Injustement méconnu, malheureusement non-lu avant la semaine dernière, ce livre mérite une place particulière, entre autre par son âge (20 ans) mais surtout par son contenu.
Pour justifier une opinion, nous utilisons trois types: (1) le jugement d'observation, (2)le jugement d'évaluation et (3) le jugement de prescription. Les mots ne sont pas des choses et les énoncés ne sont pas des faits. Comment fait-on alors pour s'entendre, pour dialoguer?
La plupart des théoriciens préfère étudier les langues artificielles pour éviter d'analyser le discours "irrationnels" des humains. Ici l'auteur démontre que le choix du type de jugement entraînera quatre formes de dialogue : (I) de stratèges (où les normes ne sont pas remis en cause) (II) de spécialistes (où les critères sont mis en en cause), (III) d'idéologues ( où les valeurs sont en cause) et (IV) de sourds (où chacun ne peut quitter sa position -pensons aux politiciens durant un débât).
La vie quotidienne nous entraînent, sans que nous soyons toujours conscient, dans ces différents types de conflits caractérisés par des structures logiques découlants de ces quatre formes de dialogues.
Un résumé ne pouvant donner grâce, je compte bien en 2005 vous en dire davantage...
Search Wizard
(Le pauvre internaute dont j'ai fait l'autopsie de sa requête la semaine dernière aurait eu grandement besoin de cet outil).
L'outil est simple, il reprend en fait la fonction avancée de Google mais disposée en rubrique: (1) Search for page with ... (2) using... (3) NOT using... (4) special feature...
La nouveauté consiste à faire apparaître en temps réel la requête dans un champ Google dans le bas de la page ("This is what your query looks like..."). C'est à dire que l'on voit comment la requête est formulée pour Google. On apprend ainsi comment utiliser les mots clefs comme site:, filetype:, le tilde ~ operator (qui permet d'inclure les synonymes : "cat" retourne 'pets', "kitty" et "animal") et les guillements (pour retrouver une phrase exacte), etc.
Il ne reste plus qu'à cliquer sur "Search" pour chercher comme il faut sur Google. Génial!
Les power users diront que ce n'est qu'une refonte ergonomique de la fonction avancée de Google. Oui, mais une belle refonte! car elle permet de visualiser la logique de requête. Google Avanced Search, à côté, donne l'impression d'être un formulaire de demande de remboursement d'assurance-invalidité de longue durée. De la part de ceux qui ont (ré)introduit le "command line" sur Internet ainsi que le design clair et minimaliste, voilà une belle leçon de utilisabilité cognitive...
Mais c'est surtout sa fonction de "reformulation de requête" qui a sucité mon attention.
Pourquoi diable avons-nous besoin de voir comment est formulé la requête dans un champ Google? Parce que nous voilà rassuré de pouvoir concocter notre requête chez soi avant de l'envoyer. On peut construire la requête en WYSIWYG (What You See Is What You Get). Un peu à la manière de la construction d'un courriel avant expédition ou d'un document avant impression.
Il est possible de monter facilement une requête plus complexe et de la modifier aussi facilement. La fonction avancée de Google cache la complexité (on découvre seulement après coup que Google a ajouté des opérateurs spéciaux), donc ne favorise pas son apprentissage. Le Search Wizard montre clairement l'opérateur utilisé, quoiqu'il ne soit pas exhaustif. D'une certaine manière, c'est un gestionnaire de requête, comme on dirait un gestionnaire de contenu.
Cette aisance cognitive que procure Search Wizard grâce à cette fonction de reformulation devrait inspirer Google. Quand on commence à simplifier celui qui a simplifié l'Internet, il y a comme un malaise...
---
Pour explorer davantage :
FaganFinder propose une version alternative de la recherche avancée de Google (et vous verrez que " la puissance" sans "le charme" n'est pas inspirant)
Cid Cédille propose une liste des principaux opérateurs de Google (en français)
GoogleGuide.com Une référence en anglais
Pour les fonctions avancees de google voir aussi
http://www.googleguide.com/advanced_operators_reference.html (merci anonymus)
Network on Wheels
1. Embarquer un serveur WLAN dans chaque voiture
2. Insérer des transmetteurs sans-fils dans chaque voiture
3. Inventer un protocole approprié pour que le réseau s'établisse entre les voitures qui se suivent.
Et vous voilà avec une extension d'Internet qui parcoure les autoroutes...
Bon, et bien, la fiction a été de courte durée, voilà que BMW, Audi, Daimler Chrysler, Volkswagen, Renault et Fiat ont reçu du gouvernement allemand les fonds nécessaires pour bâtir un standard pour un transfert "car-to-car" wireless (802.11) via IPv6.
(trouvé sur The Register, 21 décembre)
---
Pour plus d'information:
NOW: Network on Wheels (en allemand) http://www.network-on-wheels.de/ (site officiel du projet, mais pas vraiment d'info au moment d'écrire ce billet)
The ultimate interface to the planet
(mise à jour 2005: le service s'appelle mainteant Google Earth)
"Google's mission is to organize the world's information and make it universally accessible and useful. Keyhole's technology and products are an excellent addition to our efforts to do that."
Se voir comme une node d'information
"Il faut arrêter de dire que les Feeds RSS c'est geek! Il faut démystifier cela! C'est pas geek, c'est la prochaine étape, pour tous, c'est une nécessité de comprendre cela. Dire que c'est geek, c'est ne pas rendre service aux gens. C'est leur dire qu'il ne pourront pas passer à l'étape suivante, c'est paternaliste."
Le co-auteur de Dix questions et dix réponses au sujet des fils xml-rss (en format pdf) s'en prend à cette apathie qui fait dire que le grand public n'est pas prêt à adopter le fil web
Il faut évidemment abandonner tout acronyme. Comprendre le rss demande plus un travail cognitif que technique.
Je crois que nous avons presqu'atteint les 3 conditions pour que le grand public adopte le fil web :
(a) un nom prononçable : "fil web" (qui fait très bien l'affaire)
(b) l'abonnement en 1 clic (assez répandu pour les agrégateurs en ligne)
(c) l'intégration dans les navigateurs (Firefox et son liveBookmark ou Lektora
Alors pourquoi l'adoption se fait attendre?
Pour avoir des fils webs, il ne faut pas oublier 3 choses :
- il faut être devant son ordinateur plusieurs heures par jour,
- il faut vouloir lire des informations devant ce même écran
- et il faut vouloir consommer ou avoir besoin de consommer *beaucoup* d'information.
Pour prendre une métaphore simple: une page web, c'est un livre que je vais chercher à la bibliothèque. Un fil web, c'est une revue qui est livrée chez moi.
La technologie est adoptée quand elle répond à un besoin. Pour suivre des fils webs, comme pour lire des pages web à la dure (ou lire des revues papier), il faut ce qui manque toujours : du temps.
On s'abonne à un fil web (comme à une revue) quand on veut s'assurer de recevoir l'info qu'il nous manque (et pour se tenir au courant dans un domaine précis). Une salle des nouvelles a besoin de ses fils de presse pour se nourrir et ensuite créer du contenu.
Mais si quelqu'un n'est pas dans le besoin de créer du contenu (au sens large), le fil devient une surcharge d'information. Les revues s'empilent.
La plupart des gens ne se perçoive pas comme une salle de presse, c'est à dire qu'il ne voit pas l'intérêt de s'abreuver à des sources alternatives (autre que mainstream sur les médias de masse). Ils vont à la bibliothèque au cas par cas, selon l'humeur. Être au coeur d'un flux d'information live ne les intéresse pas.
C'est sur terrain que se trouve le frein à l'adoption du fil web : être capable de se voir comme une node d'information.
Si pour le particulier et la plupart des emplois, c'est compréhensible, pour tous ceux qui travaillent dans des métiers du savoir, de la science ou des relations sociales, c'est un exercice essentiel à faire.
Mais, résumons nous, pour ça il faut (1) travailler régulièrement devant un ordinateur, (2) avoir besoin d'informations fraîches, (3) et vouloir (ou être dans l'obligation de) communiquer. Il est normal que ce soit encore pour les geeks...
(CSI:Web) Autopsis d'une requete
Dans les moments qui précédaient, sur les 8 milliards de pages que Google possède, mon carnet était présenté en 4 ième position (?!) dans cette page résultat. Que s'est-il passé pour qu'une requête aussi "précise" puisse venir mourir sur mon site? Quel crime avait commis l'internaute pour se retrouver dans pareil cul-de-sac? Et quel était le mobile derrière le choix de ces mots?
Enquêtons...
Tel un légiste de "CSI" -clin d'oeil à l'émission américaine- je vais essayé de retracer le processus qui explique cette requête qui est venue terminer sa vie dans mes logs de stats. Tâche minutieuse d'inférence cognitive sous le mode d'une autopsie, nous verrons quels apprentissages en retirer, quelles leçons apprendre sur les gens -vos jeunes, vos étudiants, vos employés- qui recherchent sur le web.
Premièrement, on s'entend tous pour dire que nous, les humains (et j'inclus aussi les mutants qui postent trois fois par jour), comprenons parfaitement ce que le pauvre internaute cherchait à faire: par paresse il espérait faire l'économie d'une laborieuse recherche du dernier forfait de cellulaire dans le site de la compagnie Fido. Car la séquence de mots ("fido cellulaire promotion abonnement quebec") ne laisse aucun doute dans l'esprit de personne. En compagnie d'autres humains, au téléphone du service des ventes par exemple, cette demande, même brut (sans lien syntaxique et grammatical) est on ne peut plus clair.
Mais cet internaute a interrogé un moteur de recherche. Par pensée magique, il espérait que Google allait peut-être faire le travail à sa place. Manque de bol, voici ce qu'il a reçu:
13 résultatsIl est clair qu'à la lecture de ce résultat, notre pauvre chercheur s'est fait répondre du "bruit". Un technicien dirait "garbage in, garbage out". Pourtant... La requête possédait un (faux) degré de précision qui "aurait dû" résulter en plus de qualité dans la réponse.
Le premier résultat en tête pour les mots clefs déjà cités est le blog de Bruno Guglielminetti. (?!)
Le deuxième est la page des "conditions générales de vente" (?!) d'un site pour étudiant canadien recherchant des forfaits de cellulaires.
Le troisième est un PDF (?!) d'un plan d'affaire (??!) d'un regroupement d'anciens étudiants d'un collège (???!).
Le quatrième, c'est mon billet du mois dernier sur "Rechercher n'est pas un acte technique sans conséquence". J'y parle justement du "sens" d'une page de résultats. Mais aucun rapport avec un forfait d'abonnement Fido.
Le cinquième est un site amateur sur l'informatique en général.
Et 8 autres sites sont plus impertinents les uns les autres.
Alors, que s'est-il passé?
Reprenons chaque terme inscrit:
A) "Fido" retourne au-delà de 1 250 000 pages. Et Fido.ca arrive numéro 1.
B) "Fido cellulaire" retourne 23 800 pages. Et en "lien sponsorisé" # 1 ce jour-là se trouve "cadeaux des fêtes de Fido". Par contre, le premier lien vers une page (obscure) de Fido.ca se trouve au troisième écran.
Premier constat, à l'encontre de la croyance des power users, "raffiner" une requête avec davantage de mots ne donne pas nécessairement de meilleurs résultats. Déjà ici on voit que l'imprécision des termes vastes comme "Fido" et "cellulaire" aurait donné un bien meilleur résultat et permis de tomber dans une zone d'Internet plus propice pour trouver quelque chose de pertinent.
Que se passait-il dans la tête de l'internaute?
La logique de l'internaute est la suivante: il commence par chercher le nom de la marque "Fido". Mais il sait que ce nom est ambigu. Pour le distinguer du meilleur ami de l'homme, il fait un geste qui lui semble naturel: il lui adjoint le "métatag" "Cellulaire". Il aurait presque pu mettre à la place "téléphone", métatag interchangeable (et même que le résultat avec ce dernier mot place fido.ca dans le premier écran).
Deuxième constat, certains mots sont utilisés comme clef et d'autres comme méta-clef. Contrairement à une pensée naïve en programmation, les mots ne sont pas équivalents. (Ici Fido est le mot principal et cellulaire son attribut sémantique).
J'ai écrit récemment sur cette idée qu'une requête n'est pas un acte technique, mais un acte de communication en insistant sur le fait de ne pas laisser les programmeurs vous leurrer à ce sujet.
Pour "désambiguïser" leurs marques de commerce, certaines compagnies ont intérêt à connaître quels sont les mots clefs associés à leurs produits par les divers publics. Les étudiants aussi, dans leur recherche préliminaire, doivent connaître les mots clefs utilisés par un domaine de la connaissance pour préciser les résultats.
Continuons. Qu'avons-nous trouvé d'autre?
C) "Fido cellulaire promotion" retourne 16 500 pages. À ce moment précis le résultat s'embrouille (!). L'algorithme de Google perd la piste: Autonet.ca (?!) et cinezoo.qc.ca (??!) apparaissent dans les 6 premiers résultats. Fido.ca disparaît (???!). Seuls les liens sponsorisés proposent des liens pertinents : Bell, le concurrent de Fido.
D) "Fido cellulaire promotion abonnement" retourne 22 pages. Catastrophe appréhendée, le dérapage continue. Mon site apparaît alors en 6ieme position (!). MicroCell, la compagnie qui était derrière Fido (Fido a été racheté par Rogers) apparaît deux liens après moi (!!). Ici encore, Bell dominait les liens sponsorisés (bravo Cesart pour le positionnement).
Troisième constat, les liens sponsorisés ne sont pas des artefacts de notre culture capitaliste qui obstruent notre recherche, mais un atout non négligeable pour retrouver une information (commerciale). En attendant le web sémantique, l'argent permet de donner un coup de pouce pour faire circuler l'information.
Le pattern de recherche de l'internaute commence à se préciser: au moment où il rajoute "quebec" comme cinquième et dernier terme, nous sommes alors en mesure d' ébaucher une hypothèse pour expliquer le mobile de ce massacre.
En tapant "fido cellulaire", l'internaute effectuait, en fait, un choix de "banque de données" ( de "catalogue" comme l'on disait avant) : "Je circonscris ma requête au site de Fido")
En tapant "promotion" et "abonnement" , l'internaute effectuait la requête proprement dite. Mais un peu à la manière d'une navigation dans un répertoire et un sous-répertoire : desktop/promotion/abonnement.
Quatrième constat: certains internautes utilisent le moteur de recherche comme un outil de navigation, c'est-à-dire de façon hiérarchique ou de façon "sérendipitiesque". La relation entre l'usager et l'information se fait alors sous un mode de cache-cache : il faut croire que l'usager ne sait pas ce qu'il cherche...même s'il connaît les termes de la recherche.
En tapant "quebec" (notez l'absence d'accent - l'internaute perçoit le moteur comme anglophone; ou il sait que les accents ne sont pas pris en compte par Google), l'internaute, en fait, ajoute un critère de limite ("limitez la recherche aux promotions d'abonnement disponibles au Québec").
Cinquième constat: les internautes, s'il ne comprennent rien à la classification Dewey, possèdent une certaine forme d'intuition sur l'architecture de l'information. Mais la notion du "général au particulier" n'est pas la même du point de vue cybernétique que du point de vue humain.
Là où le programmateur aurait dit : quelle province? (Québec) / quelle service? (abonnement) / quel type? (promotion), l'humain pense l'inverse : mon intérêt (promotion) / ce que je veux (abonnement) / où (Québec). Ce dernier point n'est explicite que par ce que la machine le lui demande : l'humain se perçoit toujours ici et maintenant.
Récapitulons la requête : "Dans la base de donnée de la compagnie Fido, affichez les promotions pour les abonnements, limitées au Québec seulement".
Si ce n'est pas une requête typique pour un web sémantique, je me demande alors qu'est ce que c'est!
Ce que Google doit faire pour répondre aujourd'hui à cet internaute "en avance sur son temps", c'est de sortir de leur lab une sorte de "Google Drill Down beta", un moteur qui réordonne les requêtes pour permettre de chercher par palier :
Did you mean to explore fido.ca web site?
Ensuite Google réinterprète la requête ainsi "site:fido.ca promotion abonnement quebec" (notez le mot-clef "site:", c'est une fonction avancée de Google pour limiter la recherche aux pages d'un site seulement).
Ou encore comme ceci : Did you mean to explore fido.ca/promotion ?
Google interprète ainsi "site:fido.ca inurl:promotion abonnement quebec" (notez le mot-clef "inurl:", c'est une fonction avancée de Google pour limiter la recherche à un répertoire précis).
Mais malheureusement, Fido a construit son site de telle façon que l'information est prisonnière de l'expérience de l'interface usager. Ces requêtes retournent zéro résultat : là, la science des moteurs de recherche ne peut plus grand chose...
Les internautes surestiment la technologie et il y amplement de littérature pour expliquer pourquoi. Ce qui ressort clairement ici, c'est que l'internaute ne sait pas comment Google cherche par défaut: Google cherche des mots qui sont en cooccurrences. (L'outil de recherche avancé se trouve sur la page de Google, à un clic, pourtant).
L'avènement d'Internet offre une quantité phénoménale de documents. Mais avons-nous mis en place un système pour préparer nos concitoyens (et surtout nos élèves) pour comprendre comment maîtriser la bête?
Il est urgent d'enseigner dès le plus jeune âge:
- la méthodologie de recherche
- la logique de recherche avancée
- l'usage de *plusieurs* moteurs de recherche (c-à-d, ne pas laisser Google gagner par défaut) ainsi que leur force et faiblesse en fonction de nos besoins
- la construction de requête et l'utilisation de thésaurus
Ajout au rapport d'autopsie:
25 Dec. 2004, 19:31:06 précisément. Mes stats reçoivent de Yahoo Search Canada un autre pauvre internaute qui cherchait : "Search TELEPHONE CELLULAIRE ROGERS SANS FILS". Le présent billet était #2 sur la liste. Le premier de la liste était la page d'accueil de mon carnet. Le cinquième de la liste était mon fil web de feedburner (?!).
Que constatons-nous ici? "Search"?! On dirait un ordre de mission pour un agent. Pourquoi pas "fetch"? Ou "find"? Un peu à la manière de la sorcière de l'Est dans le Magicien d'OZ qui demande à ses chimpanzés volants de ramener (fetch) Dorothée : l'internaute a peut-être pensé qu'il envoyait un "agent intelligent" à la recherche de l'information...
Il faut conclure aussi que l'observateur modifie l'observation, car ce présent billet risque, avec cet ajout, d'attirer d'autres "hits" de requêtes perdues et si je persiste à indiquer les mots clefs de ces requêtes perdues, ce url deviendra lentement un SEBH, un Search Engine Black Hole, attirant davantage de requêtes perdues jusqu'à parasiter les moteurs de recherches...
---
Pour poursuivre la réflexion (dernière mise à jour 13 oct. '05):
Assumptions About User Search Behavior
Cognitive strategy in web searching
The effect of query complexity on Web searching results
Moteurs de recherche : apprenez la recherche orientée ‘résultat’
Astuces de recherche dans Google (par les étudiants des HEC-Montréal)
Google et la bibliotheque virtuelle
"As part of its effort to make offline information searchable online, Google (...) announced that it is working with the libraries of Harvard, Stanford, the University of Michigan, and the University of Oxford as well as The New York Public Library to digitally scan books from their collections so that users worldwide can search them in Google."Vraiment, les hyperliens auront de la concurence...
Ajout 16 déc:
Notre jeunesse qui ne peut plus se passer de Google pour leur recherche scolaire se demandera pourquoi tant d'effort pour ajouter des livres poussièreux alors que Google nous retourne déjà 1 millions de liens pour chaque mot clef.
Le corps enseignant, délesté de facto de la transmission technique du savoir, doit répondre promptement que c'est là la preuve que Internet n'est pas (encore) une bibliothèque et, a fortiori, que Google, avec son algorithme, aussi fascinant soit-il, n'est encore qu'un coup de bâton sur la piñata de la connaissance.
Ajout 17 décembre:
Pour plus d'info sur le projet de Google (le "projet Ocean") lire John Battelle, UrFist, et ResearchBuzz
Ajout 26 décembre:
http://print.google.com/ La page officiel, en quelque sorte.
Post-Scriptum: si vous vous intéressez à mes réflexions sur les bibliothèques, lisez:
- De l’utilité des bibliothèques publiques dans le futur
- Sérendipité, fortuitude, essences du web (réflexion sur une pensée d'Umberto Eco)
- Les bibliothèques face aux moteurs de recherche Internet
- Bibliothèque 2.1 (liens pour la conférence de Montréal)
- Le bibliothécaire comme DJ (sur la notion du flux)
alt txt pub
Développé par Vibrant Media, ça s'appelle IntelliTXT:
"It is a third-party technology created and distributed through Vibrant Media Incorporated, developed to locate keywords & phrases found within text and link them to relevant commercial information. IntelliTXT is identified with a double-underline and all corresponding text ads are clearly marked with 'Advertisement' or 'Sponsored Link'."
On arrête pas le progrès...
Les prisonniers de l'expérience
Ce petit bijoux en flash vous permet de formuler vos recherches afin de créer votre propre itinéraire selon vos envies : "je veux (danser | manger | boire | dormir | apprendre | etc) (entre amis | toute la nuit | etc)". Allonger la liste, pas de problème. Le site vous optimisera le chemin entre chaque lieu qu'il vous proposera. Photos, adresses, descriptions. Tout y est!
Le graphisme est excellent, la programmation épatante et le contenu étonnamment bien fournie (et bilingue !). Blue Sponge a fait là un travail remarque, tout simplement remarquable.
Malheureusement nous avons encore là une victime de l'effet diligence.
Les premiers wagons ressemblaient à des diligences et les premières automobiles, à des voitures à cheval. Les mentalités, habituées à des techniques désormais dépassées, utilisent les nouveaux outils avec des protocoles anciens, c'est ce que Jacques Perriault appelle l'effet diligence.
Ne vous méprenez pas. Je réaffirme que ce site est un petit bijoux que je recommande de mettre dans vos signets. Blue Sponge (qui va gagner de prix avec ça) a fait sur le web ce que nous rêvions tous de faire... il y a dix ans : du CD-ROM sur le web.
Le CD-ROM c'est le paradis du contrôle usager et de son interface.
Malheureusement l'information est prisonnière de cette expérience usager: pas moyen de faire des bookmarks, pas de fils RSS, pas moyen de copier le texte (sauf si on sort de l'expérience en cliquant sur imprimer : une liste banale en comparaison s'affiche platement), pas moyen de garder une photo, pas moyen de lire ou de laisser un commentaire. Faites une recherche sur Google : jamais vous ne retrouverez quoi que ce soit derrière le splash screen. L'information est jalousement cachée par le garde barrière Flash.
En construisant ainsi le site, les promoteurs se sont trompés de modèle: ils ont construit une vitrine (mais quelle vitrine!) comme un magasin avec pignon sur rue. Maintenant ils sont pris avec les mêmes problèmes qu'un magasin en brique et mortier mais...dans une "ville de 18 milliards de rues".
Ils ont construit un "produit traditionnel" et comme tout produit traditionnel il faut maintenant le vendre avec des "techniques traditionnelles": publicité, force de vente, marketing direct, promotion, branding.
Faut-il le répéter? La communication d'un produit ne se fait pas par pensée magique. Et ne comptez pas sur l'effet "viral", ça marche pour The Meatrix (parce que c'est un "message") mais pas pour un produit touristique (parce que c'est une "destination"). Je doute que le budget pub soit à la hauteur -- quand on imprime des catalogues quadricolor papier glacée, le travail ne fait pourtant que commencer : il faut aussi les distribuer...
Le produit touristique est l'exemple type de ce que j'écrivais récemment sur la findability : "You can't use what you can't find." Quand "l'usager ne sait pas ce qu'il cherche"...la probabilité qu'il trouve votre produit (votre URL) est de 1 sur le nombre de sites qu'un engin de recherche retourne ("Montréal" retourne 9 millions de page sur Google). Avec des mots stratégiques aussi vagues, madeinmtl.com nage à contre courant.
La leçon à retenir? En 2005, faites éclater la coquille! Libérez les informations, elles sont les meilleures embassadrices de votre site. Elles vont sillonner le web, se loger dans les engins de recherche, morceau par morceau. La granularité de l'information va jouer pour vous car plus la requête de l'usager sera précise plus votre info, naturellement, sera pertinente. Vous décuplez ainsi la force de Google en votre faveur et augmentez les chances que l'on tombe sur votre site...C'est ça être sur le réseau en l'an 2000! interrelié, ouvert, distribué.
Communication par sites web interposés
Voici les excuses des 49% d'américain qui ont perdu au reste de la planète : "SORRY EVERYBODY".
www.sorryeverybody.com est un site d'excuses au monde entier pour la navrante élection. Basé sur galerie de photo chacun peut adresser personnellement un message au reste de la planète qui comptait sur eux.
Et voilà que peu de temps après, la réponse survient : "APOLOGIES ACCEPTED"
www.apologiesaccepted.com est la réponse du "reste du monde".
PS (11 dec 2004) : est-ce le premier cas de ce que l'on pourrait appeller de la communication masse à masse ? C'est à dire, c'est moins des individus mais le groupe en tant que tel qui parle à un autre groupe (mais pas directement à ses constituants). Un genre de pétition visuelle s'adressant à une autre pétition visuelle? Je crois en tout cas que ce n'est pas tout à fait la même chose que le "many-to-many"...
---
Vous trouverez une conversation intéressante à propos de ces deux sites sur Captology Notebook (Stanford University) : ici, ici et ici
Web of Influence
Un des rares articles de la presse "offline" en 2004 a être vraiment intéressant. Une vision qui dépasse le point de vue (habituel) de San Francisco ou de Wall Street pour s'intéresser aussi au phénomène hors U.S.
"[T]he blogosphere serves both as an amplifier and as a remixer of media coverage. For the traditional media—and ultimately, policymakers—this makes the blogosphere difficult to ignore as a filter through which the public considers foreign-policy questions."(via Shel Holtz)