ZEROSECONDE.COM: mars 2005 (par Martin Lessard)

ZEROSECONDE.COM

Impacts du numérique sur la communication, notre société, nos vies.

Déformation blogo-professionnelle

Vous ne croyez pas que les blogs déforment les moteurs de recherche?

Hum, je viens de faire le tour de mes stats (seulement les 100 derniers résultats) et je viens de m'apercevoir que certains tombent sur mon carnet de façon tout à fait inopinée.

J'avais déjà analysé le cas d'une requête sur les cellulaires fido qui me donnait en quatrième position. Et bien, 3 mois après, me voilà premier!

On peut conclure que l'observateur modifie l'observation car mon billet qui contient les mots clefs "cellulaire Fido" deviendra lentement un SEBH, un Search Engine Black Hole, attirant davantage de requêtes perdues...

Alors pour me faire plaisir, j'ai été regarder comment mon carnet se positionnait pour les mots clefs recherchés dans les derniers jours.

Voici mon palmarès du 27 mars 2005
Il se peut que les résultats varient si vous lisez ce billet plus tard dans l'année (ou la décennie)

Mon carnet est :

1 ière position sur Google.ca pour fido cellulaire
Ces deux mots pointent sur mon billet CSI:WEB Autopsie d'une requête. Fido a de graves problèmes de positionnement, car leur site n'apparaît même pas sur le premier écran.

2e position sur Google.ca pour +technology +"fido" +cellulaire
Même chose, ça pointe au même endroit, ici

3e position sur Search.yahoo.com pour mouton insignifiant
Mon billet coupable est ici . Ça, c'est de ma faute; j'ai participé à une bombe Google. C'est un péché de jeunesse. Un peu comme la malaria, ça refait surface sur une base régulière.

4e position sur Wanadoo.fr pour NO child left behind
Ça pointe ici. Mais ce n'est qu'une citation que j'avais dans mon billet. Ça n'a aucun rapport direct avec mon sujet. Vous verrez que plus loin que Wanadoo est plutôt premier degré en matière de recherche. D'après Wanadoo, je serai donc la quatrième autorité pour parler de ce sujet très délicat.

4e ex-eaquo sur Google.fr : blog.journaux intimes
Mon billet utilise bien ces mots. (C'est Hou-Hou qui est arrivé premier sur la liste). Mais je ne suis sûr pas que ce soit dans le sens que le pauvre internaute l'entendait. N'empêche que maintenant me voilà collé dans le premier écran de Google France pour ces mots... Vivement le web sémantique pour m'en débarrasser...

6e position sur Google.fr pour la construction de la connaissance
Ah là je suis bien content! Mon billet parle bien de ça. Bravo. Sauf que je suis un peu gêné. Je passe devant des revues de synthèse, l'Université Paris-8 et le congrès de l'ACFAS. Mais bon, les Universités n'ont que ce qu'elles méritent, elles n'ont qu'à auto-archiver, comme je le disais un peu plus tôt...

7e position sur Google.fr pour Haloscan
En fait, c'est un commentaire dans ce billet qui utilise ce mot. Je suis bien surpris que je sois à cet endroit, sachant que ce service web est fort utilisé par les blogueurs de blogger (comme moi). Je me serais attendu à avoir plusieurs sites de techies avant moi. Non... Et dire que je dis rien de plus que de citer le mot dans mon commentaire. Hop. Et un autre internaute qui se cogne le nez.

8e position sur Yahoo.com pour fils rss xml quebec
Ça pointe ici , l'archive du mois d'octobre 2004. Bien. Je suis bien content. Ça a été un sujet dont j'ai beaucoup causé à l'automne. Mais que vais-je faire si je veux en parler de nouveau : vais-je modifier mes anciens billets (car ils seront retrouvés et lus) ou en écrire un nouveau et attendre un hypothétique 6 mois qu'ils percolent vers le haut de la page de recherche? Ici on touche une limite du blog dont je vous en toucherai un mot éventuellement.

9e position sur Wanadoo.fr pour intoxication chevaux
Hum. Pas fort. Un mélange cross-posts entre un billet sur Sloterdijk et son essai d'intoxication volontaire et un autre billet sur les blogs comme chevaux de Troie. Très premier degré, Wanadoo. Si j'ai empêché quelqu'un de passer à l'acte (intoxiquer des chevaux) tant mieux, mais je crois plus que le propriétaire devait être plutôt mal pris (chevaux intoxiqués) et mon carnet n'a été d'aucun secours...

10e position sur Wanadoo.fr pour chaînes de télévision de l'iraq
Voici les mots que Wanadoo a "sélectionné" (cross-posts):
enregistrées qu'elle exploite ces idées (chaînes en bleu). Mais cette chaîne concerne présupposément aussi l'historique de mon idée b :. (...) paid advertisement on my syndicated television (...) Florida hurricanes to the war in Iraq
Comment fait-on pour leur expliquer que la page d'accueil d'un blogue ne devrait pas être indexée?

Et pour finir, un petit ego-surf.

Quelqu'un a trouvé mon carnet avec les mots blog martin. Alors, j'ai fait une petite recherche pour savoir comment je me situais avec ces mots sur quelques moteurs pour me faire un palmarès...

Avec les deux mots blog martin j'arrive :

numéro 1 sur Google.fr
ex-eaquo: Google.ca
numéro 3 sur Yahoo.com
numéro 4 sur Google.de
numéro 5 sur Google.com

Pour finir, la cerise sur le sunday, j'arrive Numero Uno pour Martin Lessard sur Google.com

Ça, ça fait très classe dans les 5 à 7 : "Cherchez moi dans Google" et d'arriver premier...

Merci les blogs!

Démocratiser l'information académique

J'écrivais il n'y a pas si longtemps qu'avec la société des chroniqueurs , une certaine connaissance profane se développe parallèlement au savoir académique, Internet (par la blogosphère notamment) mets en relation une population qui s'échange des idées, des sentiments, des informations pour se construire une vision du monde.

Je disais que "le nouveau savoir qui se développe fait fi des recherches académiques parce qu'elles ne sont pas disponibles. Particulièrement dans la francophonie."

J'ai lu un article dans le Devoir d'hier (26-27 mars 2005, Page G5) qui me dit que cela pourrait bientôt changer: l'auto-archivage par les université des articles scientifiques en accès libre et en circulation gratuite s'amorce.

Marilyse Hamelin dans son article cite une étude de l'UQAM qui démontre que "les articles qui sont mis en accès libre par leur auteurs (...) ont un taux de citation de deux à trois fois plus important que les articles qui ne sont pas mis en accès libre".

L'univers des académiciens ne comporte qu'une loi : publish or perish. Et pourtant il est encore très difficile de trouver un article académique (francophone) en libre accès.

L'Université du Québec à Montréal (UQAM) se propose de promouvoir l'auto-archivage des documents scientifiques produits par les enseignants et les chercheurs de langue française dans tous les domaines.

eprints2.uqam.ca est le serveur où les documents de recherche vont se retrouver. Il supporte la version 1.1 du protocole XML "OAI-PMH" (Open Archive Initiative - Protocol for Metadata Harvesting ) . Ce protocole favorise le repérage et l'accessibilité des documents scientifiques mis en ligne dans l'archive. Pour l'instant, il n'y a guère plus d'une quinzaine de documents disponibles.

Leurs travaux se situent dans le domaine de l'information publique puisque les chercheurs sont payés par les contribuables. Pourquoi si peu d'articles sont en accès libre? On pourra discuter une autre fois sur les raisons qui ralentissent cette conversion vers Internet. L'argument des citations devrait briser leur résistance tôt ou tard. Je crois tout de même que l'avalanche est pour bientôt.

Vous comprendrez aussi pourquoi je disais l'an passé que Google Scholar était un sacré bon coup : avec l'arrivée massive de ces textes académiques la notion de "citation space" va devenir une réalité incontournable. Ce que j'appelais un "hyperlien pondéré avec un certificat d'authentification", la citation-rank, sera un enjeu majeur (et lucratif). Google deviendra le trackback et le moteur de recherche de ces documents (du moins pour le grand public).

Je perçois certains changements à l'horizon:

  1. Pour que la sphère académique s'ouvre au monde, elle doit dans un premier temps passer son discours sous forme numérique et être disponible à une adresse web. La pression du publish or perish va entraîner les nouveaux chercheurs sur ce terrains et la pression d'accès à l'information (financée par les contribuables) servira de verrou pour empêcher les autres de revenir en arrière.

  2. Dans un deuxième temps, sous forme de vulgarisation, le savoir académique pourra se voir diffuser dans le grand public grâce au relais de la blogosphère, par des chroniqueurs de la connaissance. De la même manière que la politique ou le journaliste voient son discours ou son reportage prendre un second souffle sur Internet, les académiciens verront que le grand public (ou du moins certains bloggeurs plus ou moins "profanes") devenir un vecteur de diffusion de leurs théories ou de leurs résultats de recherche.

  3. Puis par un effet réseau et selon les outils d'auto-archivages disponibles, une certaine convivialité hypermédia devraient s'installer : il sera (devrait être?) possible de linker directement à un chapitre ou à une partie d'une recherche par simple hyperlien (à cette manière) . Les universités sont des institutions qui peuvent garantir la perenité d'un hyperlien (ce qui n'est pas vrai dans la blogosphère).

  4. La légitimité des Universités devraient aider à créer cette "blogosphère intellectuelle" et pourrait à terme intégrer le trackback, les commentaires et, pourquoi pas, des forums de discussion ou des wikis.

Il est anecdotique de noter ceci : Pourquoi les universités tardent si longtemps à emboîiter le pas. Internet est pourtant (originalement) leur réseau. Elles sont en retard face à la blogosphère : démocratisez l'information académique!

Yahoo! acquière Flickr

Yahoo! se paye Flickr le service de partage de photo. (via Flickr Blog)

Flickr est reconnu pour sa culture ouverte de communauté en ligne qui utilise particulièrement les tags comme méthode de classement.

Cet achat par Yahoo! démontre le écart significatif entre leur façon de voir l'avenir et celle de Google. Google a récemment fait des démarches pour supporter Wikipedia (hébergement et bande passante - sans échange d'espace publicitaire)

-Yahoo! acquiert. Google supporte.
-Yahoo! s'intéresse aux images. Google aux mots (Del.icio.us pourrait par exemple être un spin off de leur lab)
-Yahoo! est dans le high bandwidth. Google est dans le low bandwidth.
-Yahoo! fait de l'entertainment. Google cherche à organiser l'information (mondiale) et la rendre disponible.
-Yahoo! est dans la publicité. Google dans l'association d'idée.
-Yahoo! vend de la quantité. Google de la qualité.
-Même leur notion de privauté n'est pas la même...

Je ne sais pas ce que vous en pensez, mais on dirait un combat idéologique, plus qu'une simple lutte commerciale...

Safari friendly

Oyez navigateurs Safari : j'ai réglé mon bogue d'affichage qui basculait les billets sous ma barre de gauche, les obligeant ainsi à défiler la page des kilomètres de long.

Une simple histoire de UL qui ne s'était pas terminé au LI

C T réglé ;-)

L'autorité cognitive sur Internet

Je plante une graine.

Une graine pousse dans deux directions. Par la racine et par la cîme. La racine, c'est le passé, les idées des autres, les pistes précédentes. Je cherche à savoir dans quelle mouvance elle s'inscrit, qui m'a précédé. La cîme, c'est une direction de l'avenir, les idées nouvelles, les pistes à découvrir. Je cherche à connaître qu'est ce qui me fascine tant sur le sujet

Par autorité cognitive j’entends celle définie par Patrick Wilson (1983) :
« We shall say that person A is a cognitive authority for person B with respect to sphere of interest S to the degree that what A says about questions falling within sphere S carries weight for B. »
(voir mon billet Qu'est-ce que l'autorité cognitive?)
Internet joue maintenant certains rôles d’éducation qui étaient tenus par les écoles. Dans un document de l'OCDE sur l'école de demain, une conclusion sautait aux yeux :
« Il se pourrait fort que le moyen le plus radical d’assurer un développement systématique de la formation tout au long de la vie réside dans la formule de la « déscolarisation », car celle-ci aurait pour effet de supprimer toute frontière bien définie entre la formation initiale et le large éventail des possibilités d’apprentissage qui peuvent s’offrir tout au long de l’existence. Beaucoup craignent que le défaut de gestion susceptible d’être engendré par l’existence de « réseaux d’apprenants » et l’absence d’équité qui pourrait résulter de « l’extension du modèle du marché », ne l’emportent sur les avantages éventuels. »
(source : L'avenir de l'école et la formation tout au long de la vie (PDF, 2003) page 9)
Internet a engendré un réseau d'apprenants.

Si les idées et les informations circulent de façon fluide sur le réseau, plusieurs sont transmises sans jugement critique ni autorité. Ce qui pose la question de la fiabilité de l'information disponible sur les réseaux et de la compétence des usagers pour la traiter.

Ce que Michel Cartier appellait « le passage des spectateurs anonymes et passifs aux utilisateurs interactifs » s'est réalisé.

Mais pourquoi aujourd'hui? qu'y a-t-il de différent?

Je citais six points en septembre dernier concernant cette évolution subtile de l’avalanche d’information sur la place publique dans les dix dernières années.
1- Nous sommes passé de la dépendance à l’autonomie des usagers : l'affranchissement des usagers face aux médiateurs (documentalistes, bibliothécaires, journalistes, etc.) qui filtraient l’information de qualité force aujourd'hui le développement de nouvelles stratégies de recherche.

Lire The Information Industry Revolution: Implications for Librarianswe became increasingly concerned that professionals and researchers sincerely believe that searching (...) Google, is "good enough.") et Cognitive Stategy in web searchingour research is to develop an empirically-based model of web searching, to help explain how people search for information on the Web»)

2- Démultiplication exponentiel des sources d’information : l'auto publication offert par le web augmente la quantité de documents disponibles en évacuant la question de légitimité. Les blogues ne sont que l'ultime vague.

Lire How much information (2003)This study is an attempt to estimate how much new information is created each year»).

3- L'entrée fulgurante des moteurs de recherche dans nos vies : l'outil est devenu en une décennie une commodité pour trouver de l’information en simulant une compétence de recherche.

Lire Recherche d’information sur Internet : où en sommes-nous, où allons-nous ? Alexandre Serres de l'URFIST de Rennes y distingue schématiquement quatre modalités de recherche d’information : la navigation arborescente (dans les annuaires thématiques, les classifications), la navigation hypertextuelle (dans les sites Web, les cédéroms, les encyclopédies), la recherche par interrogation des banques de données, des catalogues, et la recherche en texte intégral (moteurs de recherche).

4- Montée de la sérendipité comme "adjuvant précieux de la recherche": la maîtrise de l’entropie informationnelle passe par une forme chaotique de recherche. On est passé à l'ère où un document significatif se découvre par hasard au détour d'un clic.

Lire Chercher faux et trouver juste, Serendipité et recherche d'information de Ertzscheid et Gallezot (2003). (« (...)il n'est pas nécessairement plus facile de trouver de l'information dans un système ordonné, structuré et formaté que (...) dans un système d'information caractérisé par une forte entropie [comme le web]»)

5- Déplacement de la barrière à l’entrée : si l'accès à l'information n'est plus un problème, la capacité de traitement de cette information est devenu la nouvelle barrière. « A la différence du problème des outils de recherche, sans cesse perfectionnés, la question de l’évaluation reste, in fine, une question purement cognitive, non automatisable, renvoyant à la dimension "humaine" de l’information. » (Introduction : Problèmes et enjeux de l’évaluation de l’information sur Internet, Alexandre Serres, 2002).

6- Nouvelles stratégies pour retrouver des autorités cognitives : les filtres légitimants ont été court-circuités et la validation d'un document repose sur l'usager. Aujourd'hui, l'usager a accès à ces documents et il lui incombe d'identifier ce qui est digne d'être lu/vu/entendu, en un mot, de légitimer la connaissance qu’il accède.

Un nouveau rapport à la connaissance s’installe. Et c’est l’objet que je veux étudier : l’autorité cognitive sur Internet.

Mes questionnements sur le nouveau rapport à la connaissance

  • Quels sont les codes de reconnaissance sur lequel un usager d'Internet se repose pour décréter une information pertinente?

  • Comment la communication en réseau utilise une nouvelle forme de persuasion pour transmettre la confiance en l'absence de garde-barrière?

  • À quoi ressemble le nouveau mécanisme procédural de légitimation de l'information?

  • Comment se forme les nouveaux réseaux de collaboration entre pairs reposant sur la confiance ?
La négociation de sens passe par une découverte inductive de l’autorité qui a composé le message (ou autorisé sa diffusion). Comme dans le cas d’acquisition et de construction de connaissance par les jeux vidéo (Sim city, Vice city, Myst, Metal gear), où les règles sont découvertes en avançant dans le scénario, une inférence abductive de la part de l’internaute relie des règles d’interprétation pour créer une généralisation.

« L’abduction est un procédé typique par l’intermédiaire duquel, en sémiotique, on est en mesure de prendre des décisions difficiles lorsque l’on suit des instructions ambiguës » (Umberto Eco, Les limites de l'interprétation).

Cette notion d'abduction vient de Peirce, c'est l'activité cognitive que l'on fait quand l'on voit des grains à côté d'un sac : une forme d'affordance circonstancielle nous pousse à penser que les grains viennent du sac. Or rien ne nous dit que le sac renferme d'autres grains ni qu'ils ont pu s'en écouler. Ce qui porte peu à conséquence pour les grains est en revanche crucial quand il s'agit d'interpréter ce que l'on trouve sur Internet

Trois approches en cours me permettent de croire que de telles questions correspondent à un courant de fond (et non pas une mode passagère) :

La Standford University Web Credibility Research Lab se propose d’étudier la "captology", c'est-à-dire les ordinateurs comme technologies de persuasion . B.J. Fogg y étudie les mesures de la crédibilité, le niveau d’engagement et les réseaux de confiance.

À l’URFIST de Toulouse Olivier Ertzscheid (blog) étudie les usages experts et novices en recherche d'information, les modes et stratégies de navigation et la formalisation des concepts de sérendipité en recherche.

Sébastien Paquet propose depuis quelques années la cognitique personnelle en ligne et son utilisation en recherche comme outil de partage de connaissance sans l’intermédiaire des institutions. Malgré les apparences, les carnets favorisent la qualité par le pouvoir des hyperliens (il existe une corrélation entre la qualité d'une page web et son nombre de liens y pointant)
En ayant ces recherches comme toile de fond, je me propose d’engager la mienne sur trois axes :

  1. Le processus d'attribution de l'autorité cognitive à un document (page web, carnet, pdf, etc) trouvé sur le web à partir d'une recherche ad hoc sur un nouveau domaine de la connaissance qu'il cherche à acquérir.


  2. L'apport de la sérendipité comme stratégie pour maîtriser l'entropie informationnelle et comment elle engendre une problématique de l’autorité cognitive.


  3. Répercussion sur la perte de pouvoir des autorités cognitives et institutions existantes (notamment l'enseignement et les médias traditionnels) face à la montée des nouveaux « apprenants » sur Internet.
Je ne suis pas encore arrêté sur des aspects plus pointus concernant l’épistémologie, la méthodologie et la théorie à adopter. Ce sera à l'université que je développerai ces aspects.

Sur ce carnet, ma recherche portera autant vers la racine que vers la cîme, au fil de mes découvertes. La graine est posée.

Par les racines, peut-être que certains termes changeront afin de m'inscrire dans un courant existant (par exemple on parle de gestion de confiance ou de réputation, est-ce que le terme autorité cognitive y est associé?). Des études ont déjà été fait sur les leaders d'opinions et la réception et l'interprétation des textes, alors je chercherai en quoi Internet apporte une différence (s'il y en a).

Par la cîme, peut-être que la collaboration par réseau sera profitable pour faire germer une théorie intéressante. Quand je vois des écoles comme l'institut St-Joseph qui sont en train de former les travailleurs de la connaissance de demain, je me dit que je ne dois pas être le seul préoccupé par cette question...

Il peut paraître paradoxale que je souhaite entrer dans une institution légitimante comme l'université pour y étudier la perte de légitimité de ces mêmes université face à l'Internet*. Ce l'est. Je crois de plus en plus à la force du réseau. Ce sera quelque chose que je devrai résoudre avant d'accepter d'y entrer. Mais ce ne sera que la plus simple des complications qui m'attendent...



*Mise à jour: Ce billet est l'esquisse remanié d'un projet de recherche que j'avais déposé à l'Université de Montréal à l'époque où je cherchais à y entrer pour faire un doctorat (2005). Le projet n'a pas trouvé de terreau fertile. Mais il chemine ici, sur ce blogue, à sa manière, peut-être de façon moins contraignante.

La blogosphère est un vivier de théories profanes

En posant la question récemment qui, du savoir académique ou du savoir profane, a une meilleure connaissance du monde, on serait tenté évidemment d'hiérarchiser sur une échelle de valeur la qualité des savoirs.

Mais y a-t-il un différence?

Il y a dans la méthode académique une méthodologie puissante qui permet de construire une connaissance de façon structurée et perenne.

Le savoir profane, moins rigoureuse, offre néanmoins les qualités du "bons sens commun". Mais il faudrait alors déterminer la signification du sens commun.

Tous les deux offrent des excès. Le premier dans quadropillectomie (l'art de couper les chevuex en quatre) et l'autre dans la paranoïa collective (rumeurs et conspiration).

Mais tous les deux découlent d'un processus cognitif. Le raisonnement de l’activité académique fait partie du bagage que chacun utilise (ou peut utiliser) pour émettre son savoir profane.

Alors la différence réside dans le fait que la connaissance scientifique demande la suspension des croyances et des désirs.


Savoir profane et Folks Theories?

Le savoir académique, structurellement, permet la construction de certains savoirs qui nécessitent un long apprentissage. Une fois arrivée à un pallier conceptuel, ce savoir passe dans le sphère profane. Pensons à Galilé, Newton ou Einstein : leurs révolutions des esprits ne nécessitent plus une formation poussée pour être comprises aujourd'hui (du moins sous leur forme vulgarisée).

Mais aujourd'hui justement, à part d'exceptionnel domaine pointu, la somme des savoirs manipulés par le public profane correspond à un celui d'esprit très avancé à une époque précédente.

Les humains forment des théories sur le monde qui les entoure : nous serions des scientifiques. On collectionne des données, forme des hypothèses, transforme nos idées en tenant compte des données.

Mais les capacités cognitives des profanes reposent encore sur des corps de croyances (ou de connaissances ?) qui constituent des “théories naïves” (appellé aussi folk theories) des domaines manipulées.

Quand on parle de gestion de la connaissance (km) on parle pourtant de ce savoir profane. Quel serait l'intérêt alors si ce savoir là était méprisé? Si ce n'était que des folk thories, pourquoi s'y attarder?

La blogosphère est un vivier de théories profanes. Internet génère la construction et le partage d'une connaissance profane qui n'a pas reçu l'aval d'une institution légitimante. Un savoir émerge et elle se crée ses propres outils d'auto-légitimation.

Je vais vous entretenir sur cet objet de recherche qui me passionne au cours des prochaines semaines...

Rencontre du troisième type

David Weinberger a écrit un texte séminal, qui résume de façon brillante la place que peut prendre la "tagsonomy/folksonomy" dans la catégorisation de la connaissance, avec une mise en contexte simple et éclairant. (via Arkandis)

Taxonomies and Tags: From Trees to Piles of Leaves


"The idea that knowledge is shaped like a tree is perhaps our oldest knowledge about knowledge. Now autumn has come to the forest of knowledge, thanks to the digital revolution. The leaves are falling and the trees are looking bare."

Il décrit les trois types de catégorisation de la connaissance: les arbres, les classifications à facette et les "tags":

  • Because they are unambiguous, trees work well where information can be sharply delineated and is centrally controlled. Users are accustomed to browsing trees, so little or no end-user training is required. But trees are expensive to build and maintain and require the user to understand the subject area well: How do you find the recipe for bread soup if you don’t know to look in the “Tuscan Cooking” category?

  • Faceted systems work splendidly where an application is being used by such a wide range of users that no one tree going to match everyone’s way thinking. They are also easier maintain than trees because adding new item requires only filling in the information about facets, rather having make decision exactly which category it should go into.

  • Tagging systems are possible only if people are motivated to do more of the work themselves, for individual and/or social reasons. They are necessarily sloppy systems, so if it’s crucial to find each and every object that has to do with, say, apples, tagging won’t work. But for an inexpensive, easy way of using the wisdom of the crowd to make resources visible and sortable, there’s nothing like tags.


Avec la tagomania en cours, une nouvelle façon (bottom up) apparaît pour catégoriser collectivement l'information. "(....) that will invoke innovation and businesses – and problems – we necessarily cannot anticipate."