dimanche 20 juillet 2025

Le Banquier anarchiste - Fernando Pessoa

Le Banquier anarchiste - Fernando Pessoa

Le banquier anarchiste de ce petit texte de 1922 est un sacré sophiste. Pour justifier sa position invraisemblable, il multiplie les arguments fallacieux, et c'est d'autant plus dérangeant que ceux-ci sont entrecoupés de pointes de pertinence.

Je ne suis pas un expert de la théorie anarchiste, mais son point de départ me semble complètement à côté de la plaque. En gros, son anarchisme prône la destruction de toutes les fictions sociales et « n'admet pas d'autres lois que celles de la Nature ». On aimerait bien savoir à quoi ressemble cette vie qu'il prétend idéale, mais il n'essaie même pas de décrire. Quoi, les fictions sociales ne seraient pas partie intégrante de la nature humaine ? J'en doute. De même, son anarchisme prône un pur individualisme et rejette la solidarité et l'altruisme, sous le prétexte fallacieux qu'aider, ce serait réduire la liberté d'autrui. On dirait du Ayn Rand.

Là où sa perspective est pertinente, c'est qu'à travers son expérience de militant anarchiste, il a pu constater que dans les groupes militants à priori idéalistes se formaient inévitablement des rapports de domination ou — horreur contre-nature — d'altruisme. Dans cette même veine, il n'a aucun espoir à propos de la révolution russe, qui pourtant était encore jeune à l'époque. L'idéal peine à s'actualiser.

Ceci dit, il va de soi que cette imperfection inévitable de tout mouvement politique n'empêche pas ces mêmes mouvements d'avoir un impact significatif sur la réalité sociale. Lui cependant se sert de cette réalisation comme d'une excuse pour se lancer dans le combat anarchiste en solitaire. La suite de son raisonnement tordu, on le devine, le mène à la liberté individuelle, liberté conquise en embrassant le « système bourgeois ». Il se gargarise en affirmant n'avoir rien ajouté de nuisible qui n'existait déjà (le système en place) là où son engagement militant précédent rajoutait de la nuisance (les rapports de domination et d'entraide dans un mouvement qui pourrait aisément ne pas exister). Finalement, son « anarchisme » est celui de tous ceux qui cherchent pragmatiquement l'indépendance financière.

Il est toujours très facile de justifier à postériori ses actions, de trouver de la moralité et de la rationalité à sa situation présente. On le fait tous. Je suppose que c'est un pilier indispensable pour grappiller un minimum de santé mentale. Reste à essayer de ne pas être complètement dupes.

mercredi 16 juillet 2025

La Conquête de Plassans - Zola

Celui-là, il va vers le bas de ma liste des romans de Zola, par ordre de préférence. La faute à une trame plus paresseuse que d'habitude et à des personnages fades. L'abbé Faujas débarque à Plassans pour faire passer la ville au bonapartisme à l'occasion des élections à venir. Il s'installe avec sa mère, symboliquement entre les maisons qui servent de QG aux deux courants politiques qu'il doit manipuler, en locataire dans la maison de François et Marthe Mouret, deux bourgeois ennuyeux qui coulent vers la folie. Il est rejoint ensuite par sa sœur et son beau-frère, deux médiocres avides. En parallèle de la conquête de Plassans se déroule la conquête de cette maison.

Aucun personnage n'a véritablement su accrocher mon intérêt. Les Mouret sont sympathiques au tout début, dans leur petite vie bien rangée, et à travers la perspective curieuse de François sur cet abbé qui vient bousculer ses habitudes, mais ils sombrent rapidement dans une démence "naturaliste" qui leur enlève leur volition sans offrir grand-chose en retour. Si Marthe sert à Zola pour explorer un peu le concept de folie lucide, François, le personnage jusque-là le plus vivant, devient carrément catatonique. L'abbé lui-même ne prend pas le relai narratif, il est distant, froid, et on comprend difficilement ses motivations dans cette affaire. Que veut-il vraiment ? Qui est-il vraiment ? Restent la sœur et le beau-frère, qui n'ont pas le piquant d'autres médiocres de Zola. Certains personnages secondaires ont du potentiel, notamment ce couple de mondains cyniques, et la mère de Marthe, parvenue déjà héroïne de La Fortune des Rougon, mais on les voit trop peu.

Quant à cette conquête de Plassans, c'est un joli tour de force politique non dénué de force narrative, ni d'intemporalité dans les machinations décrites, mais ça reste trop distant à mon goût, trop flou, et surtout trop peu porté par les personnages centraux. Pourquoi est-on si peu dans la tête de Faujas, l'architecte de cette conquête ? On se contente d'assister de loin à ses actions. Zola m'a complètement perdu après la victoire aux élections, où il ne lui reste plus qu'à longuement décrire la sordide chute de ses personnages, qui sont déjà bien bas.

samedi 12 juillet 2025

Comment s'y prend la sève pour monter dans les arbres ? (vidéo)

 


Lien direct vers la vidéo sur Youtube.

Voilà que je me mets à ce qui ressemble dangereusement à de la vulgarisation scientifique. C'est très difficile : je m'efforce à la fois d'être aussi clair que possible et de ne pas dire de bêtises, mais je sais que je dis forcément des bêtises. En tous cas, l'exercice est stimulant. 

lundi 7 juillet 2025

The Urgency of Interpretability - Dario Amodei

John Martin - Manfred et la sorcière des Alpes
 

Un autre article très récent (avril 2025) de Dario Amodei, le patron d'Anthropic. Encore une fois, je précise que je n'ai pas d'opinion tranchée sur l'avenir des IA et des LLM. Quel que soit l'avenir de ces technologies, c'est passionnant, comme une injection de SF dans le quotidien. Sur ces mêmes questions, voir AI 2027 et Machines of Loving Grace.

Dans le fabuleux monde des grands modèles de language (LLM), l'interprétabilité consiste à comprendre le fonctionnement interne de ces systèmes. C'est potentiellement un enjeu considérable, car avec la compréhension vient non seulement la possibilité du contrôle, mais aussi de nouvelles opportunités de recherche et de développement.

Dario Amodei souligne que ce manque de compréhension est assez inédit dans l'histoire de la technologie informatique.

If an ordinary software program does something—for example, a character in a video game says a line of dialogue, or my food delivery app allows me to tip my driver—it does those things because a human specifically programmed them in.  Generative AI is not like that at all.  When a generative AI system does something, like summarize a financial document, we have no idea, at a specific or precise level, why it makes the choices it does—why it chooses certain words over others, or why it occasionally makes a mistake despite usually being accurate.  As my friend and co-founder Chris Olah is fond of saying, generative AI systems are grown more than they are built—their internal mechanisms are “emergent” rather than directly designed.  It’s a bit like growing a plant or a bacterial colony: we set the high-level conditions that direct and shape growth, but the exact structure which emerges is unpredictable and difficult to understand or explain.  Looking inside these systems, what we see are vast matrices of billions of numbers

Cette nature émergente rend difficile la prédiction des comportements des IA. 

Au-delà des questions de sécurité, Dario Amodei mentionne que l'interprétabilité permettrait de déterminer si les IA sont de simples pattern-matchers ou des créatures possédant ce qui s'approche d'une conscience. Personnellement, je ne suis pas certain que la frontière soit claire entre les deux : quand un humain converse, les mots ne sont pas choisis par une conscience décidante ; dans une certaine mesure, les mots apparaissent, sont générés, selon des enchainements logiques, probabilistiques. Il en va de même pour la pensée.

La discipline qui consiste à tenter d'ouvrir la boite noire que sont les réseaux de neurones artificiels s'appelle spécifiquement interprétabilité mécaniste. L'auteur en retrace brièvement l'histoire, avant d'évoquer les pistes actuelles qui permettent au domaine de progresser. Je cite quelques passages.

We quickly discovered that while some neurons were immediately interpretable, the vast majority were an incoherent pastiche of many different words and concepts.  We referred to this phenomenon as superposition,  and we quickly realized that the models likely contained billions of concepts, but in a hopelessly mixed-up fashion that we couldn’t make any sense of. The model uses superposition because this allows it to express more concepts than it has neurons, enabling it to learn more.  If superposition seems tangled and difficult to understand, that’s because, as ever, the learning and operation of AI models are not optimized in the slightest to be legible to humans.
The concepts that these combinations of neurons could express were far more subtle than those of the single-layer neural network: they included the concept of “literally or figuratively hedging or hesitating”, and the concept of “genres of music that express discontent”.  We called these concepts features, and used the sparse autoencoder method to map them in models of all sizes, including modern state-of-the-art models.  For example, we were able to find over 30 million features in a medium-sized commercial model (Claude 3 Sonnet).  Additionally, we employed a method called autointerpretability—which uses an AI system itself to analyze interpretability features—to scale the process of not just finding the features, but listing and identifying what they mean in human terms.
Finding and identifying 30 million features is a significant step forward, but we believe there may actually be a billion or more concepts in even a small model, so we’ve found only a small fraction of what is probably there, and work in this direction is ongoing.  Bigger models, like those used in Anthropic’s most capable products, are more complicated still. 
Once a feature is found, we can do more than just observe it in action—we can increase or decrease its importance in the neural network’s processing. The MRI of interpretability can help us develop and refine interventions—almost like zapping a precise part of someone’s brain. Most memorably, we used this method to create “Golden Gate Claude”, a version of one of Anthropic’s models where the “Golden Gate Bridge” feature was artificially amplified, causing the model to become obsessed with the bridge, bringing it up even in unrelated conversations.
L'objectif le plus important de l'interprétabilité étant probablement de pouvoir faire un scan des modèles afin de détecter des "maladies" (des mésalignements) et pouvoir les corriger. 

Une simple phrase pour résumer :
We are thus in a race between interpretability and model intelligence.  

mardi 1 juillet 2025

Supercommunicators - Charles Duhigg

Plongée rapide dans le développement personnel mainstream et américain #5

Le dernier livre de l'auteur de The Power of Habits. J'ai beaucoup aimé, sûrement parce que je suis peu familier avec ce genre de littérature ; c'est encore assez neuf pour moi. Comme toujours, il y a de longues anecdotes narratives pour illustrer le propos, mais Charles Duhigg parvient à les utiliser bien mieux que d'autres auteurs. J'ai trouvé la plupart de ces histoires claires, plaisantes à suivre et réellement édifiantes (sauf celle à la fin sur les questions d'inclusivité chez Netflix, très ancrée dans les problématiques américaines d'ethnicité et de genre, où certains mots sont totalement tabous). Quant aux propos et analyses de l'auteur, c'est inégal, mais globalement pertinent.

Il organise son livre le long de 3 problématiques qui, selon lui, seraient au centre de la communication humaine :

  • De quoi parle-t-on ? Ce début, non dépourvu d'intérêt, m'a cependant semblé trainer en longueur, faisant presque office d'une trop longue introduction.
  • Que ressent-on ? De loin la partie qui m'a le plus intéressé. Le cœur battant du livre.
  • Qui sommes-nous ? Le début de ce chapitre, qui explore tous les blocages qui peuvent être liés aux questions d'identité, continue à être captivant. Ensuite, les problématiques d'inclusivité évoquées me semblent sortir du propos du livre et le ton devient moralisant.

Un mot sur ce type de littérature. On peut avoir l'impression qu'un livre de ce genre tend à l'artificialisation et l'uniformisation de la communication ; l'impression que c'est comme un livre de recettes qu'il conviendrait d'appliquer aveuglément, gommant les précieuses idiosyncrasies. Je vois plutôt ça comme une quête de la compréhension. Il est toujours mieux, intrinsèquement, d'augmenter son niveau de compréhension. Les conséquences ne peuvent qu'être positives. 

Je relève ci-dessous quelques idées.

Identifier le genre de communication dans lequel on s'engage : pratique, émotionnelle ou social (sûrement la plus commune). Simplement percevoir cette disposition et y répondre par la même disposition (ou en changer, mais en toute conscience). Entrer en concordance de disposition ne signifie pas imiter cette disposition. C'est comprendre ce que l'interlocuteur attend, ou veut, de la conversation.

Les questions concernant les simples faits ont tendance à être des impasses. En revanche, il est toujours possible de transformer ces questions en impliquant les émotions. C'est la différence entre "Où habites-tu ?" et "Comment ce lieu de vie t'affecte ?". On invite les émotions, les préférences, les valeurs. Parfois, ces approfondissements rendent inconfortables, d'où l'importance de la réciprocité. Si une personne s'ouvre, s'ouvrir en retour est capital. Les questions intimes (et savoir en trouver l'intensité adéquate) permettent une ouverture émotionnelle beaucoup plus propice aux conversations "productives".

Par exemple, la différence est énorme entre présupposer l'état émotionnel d'une personne et travailler à comprendre cet état émotionnel par la conversation. Demander "Comment tu te sens ?" ou "Que ressens-tu ?" ne suffit pas, car souvent la personne n'en a elle-même aucune idée. Les questions peuvent gagner à être détournées, à examiner l'état émotionnel via le rapport à des évènements concrets. La façon la plus classique de faire comprendre qu'on s'intéresse sincèrement à ce que dit autrui est de le reformuler et de demander confirmation et/ou développement ; montrer sans ambiguïté qu'on comprend leur perspective.

Les émotions sont comme un aimant pour l'attention. Leur expression est limitée par la peur de la vulnérabilité (et j'ajouterai par le manque de connaissance de soi). Je suis persuadé que la plupart des gens souffrent d'un profond manque d'expression et de connexion intime et émotionnelle, souvent inconsciemment. La puissance d'une conversation intime, profonde et réciproque est sous-estimée. Peu de choses sont plus satisfaisantes.

En conversation, le rire existe moins comme une réaction à ce qui est drôle que comme outil de connexion émotionnel. D'où l'importance de toutes les nuances du rire : le rire n'a cet effet de connexion que quand ces nuances (intensité, ton, etc.) sont partagées. Les signes que l'on veut une connexion créent une partie de cette connexion.

Je repense à cette anecdote, peut-être trouvée chez Jared Diamond, et sans doute concernant la Nouvelle-Guinée : les humains primitifs en vadrouille, quand ils rencontraient un inconnu, s'installaient et prenaient le temps de se trouver des parents communs. Le premier réflexe, pour savoir quelle attitude adopter, et donc pour chercher la conciliation, était de se trouver une identité commune. On retrouve cette idée ici, avec la nuance que les groupes d'appartenance sont beaucoup plus nombreux. On fait tous partie de nombreux groupes d'appartenance. Nombre de conversations se résument d'ailleurs à chercher des identités communes. Établir ces identités communes est un puissant raccourci vers la connexion. De même pour les valeurs communes, qui peuvent être au fondement de comportements et d'opinions à priori opposées.

L'auteur conclut pertinemment sur l'importance capitale des relations sociales satisfaisantes dans le bien-être humain.