Pop’Sciences répond à tous ceux qui ont soif de savoirs, de rencontres, d’expériences en lien avec les sciences.

EN SAVOIR PLUS

Publications clandestines et autoédition en RDA : tracts et samizdats

PPublications clandestines et autoédition en RDA : tracts et samizdats

Le séminaire du Centre Gabriel Naudé, laboratoire de recherche de l’Enssib, se propose d’inviter un jeudi par mois un chercheur ou une chercheuse à présenter ses travaux en cours ou tout juste achevées en histoire du livre et de l’imprimé, du Moyen Âge à nos jours. Toutes les échelles, du micro au macro, toutes les approches, de l’histoire économique et sociale à l’histoire culturelle, de l’histoire politique à l’histoire religieuse, en passant par l’archéologie du livre et la bibliographie matérielle peuvent être mobilisées par les intervenants et intervenantes.

 

Séance du 4 avril 2024 | Hélène Camarade, professeure à l’université Bordeaux Montaigne : « Publications clandestines et autoédition en RDA : tracts et samizdats ».

Cette communication propose de revenir sur la production de tracts (feuilles volantes) et plus généralement de samizdats pendant la République démocratique allemande (RDA) entre 1949 et 1990. Le samizdat est une abréviation tirée du russe qui signifie « autoédition ». Il désigne les écrits autoédités en marge des circuits officiels de publication dans les pays d’Europe centrale et orientale à l’époque soviétique, notamment entre les années 1950 et 1990. Ces écrits paraissent en général dans la clandestinité ou la semi-clandestinité.
Nous verrons comment les samizdats permettent de contourner la censure et de faire entendre des voix dissidentes dans l’espace public contrôlé par le parti communiste, jusqu’à constituer un espace public oppositionnel de nature pluraliste qui prépare les bouleversements de 1989/1990. Nous évoquerons à cet égard la position particulièrement de la RDA en Europe centrale, située à côté de la République fédérale d’Allemagne, qui représente une véritable sphère publique de substitution en langue allemande.

 

Hélène Camarade est professeure en études germaniques à l’université Bordeaux Montaigne.  Elle est spécialiste de la résistance allemande au national-socialisme et de l’opposition en RDA. Elle travaille principalement sur les écrits de la résistance.

Inscrivez-vous

 

>>> Pour en savoir plus sur le Centre Gabriel Naudé

  Consultez le site web 

 

Infobésité : s’informer sans se faire matrixer

IInfobésité : s’informer sans se faire matrixer

Combien de messages recevez-vous par jour ? Quel est votre rapport à l’information à la maison, au travail ou même dans la rue ? Est-ce que vous avez déjà ressenti de la fatigue informationnelle ?

L’information n’a jamais été aussi accessible, ce qui est a priori une bonne nouvelle. Pourtant, plus d’un français sur deux dit souffrir de fatigue informationnelle. Nous sommes pris dans un véritable raz de marée de données où il devient impossible de savoir démêler le vrai du faux, à quel média faire confiance ou échapper à des articles mis en avant seulement pour faire le buzz.

Comme à son habitude, l’association Scène 27 organise un événement propice aux rencontres pour échanger sur un sujet de société avec notre jeu P.O.V, pour découvrir notre librairie partenaire sur le sujet et écouter des « talks » d’experts  dans une ambiance décontractée et bienveillante !

Cela vous intéresse ? Ne tardez pas à réserver vos places !

Scène 27

La cryptographie face à la menace quantique

LLa cryptographie face à la menace quantique

Faut-il s’inquiéter pour la sécurité de nos communications ? Comment renforcer les méthodes cryptographiques afin de les rendre résistantes face à l’avènement éventuel de l’ordinateur quantique ?

Benjamin Wesolowski, mathématicien et cryptologue à l’Unité de mathématiques pures et appliquées, évoque les nouveaux défis de sa discipline pour CNRS le Journal.

Lire l’article complet

Quelles médiations pour l’EMI ?

QQuelles médiations pour l’EMI ?

L’Éducation aux médias et à l’information (EMI) apparaît comme un enjeu majeur des problématiques sociétales contemporaines. Avec le soutien du ministère de la Culture, l’Enssib et l’Inspé de l’Académie de Lyon organisent en 2023-2024 trois journées d’étude afin de favoriser la formation des professionnels à l’EMI.
ormation des professionnels à l’EMI. Après une première journée intitulée « L’EMI forme-t-elle des citoyens? », cette deuxième journée s’intéressera aux médiations en EMI.
La troisième journée aura lieu le 5 juin 2024 et explorera la notion de paysage informationnel.

Programme

  • 9h30-10h45 | La nature des médiations en EMI
    Conférence d’Amandine Kervella, maîtresse de conférences, chercheuse en Sciences de l’information et de la communication à l’ENPJJ de Roubaix et membre du laboratoire GERiiCO : « Penser l’EMI à travers les professionnel.les qui la mettent en œuvre : entre collaborations, confrontations … et compétitions ? »
  • 10h45 – 11h | Pause
  • 11h – 12h15 | Les questions didactiques et le rôle des partenariats entre différentes structures dans la construction de programmes pour l’EMI
    Conférence de Béatrice Micheau, maître de conférences en Sciences de l’information et de la communication à l’INSPE Lille et membre du laboratoire GERiiCO de l’Université de Lille
  • Pause déjeuner libre
  • 14h-15h30 | Dispositifs d’EMI et partenariats dans le champ scolaire et en bibliothèques
    Table ronde modérée par Nathalie Nouailles, doctorante en sciences de l’information et de la communication, Laboratoire LERASS,  Université Paul Sabatier. Avec la participation de :
    – Sandrine Marinot, documentaliste au lycée Édouard Herriot, Lyon
    – Charlène Paumier, documentaliste INSA de Rouen
    – Malika Laval, bibliothécaire à la médiathèque de Vaise, Bibliothèque municipale de Lyon
  • 15h30 -15h45 |Pause
  • 15h45- 16h30 | Présentation du numéro 1 de la revue Balisages sur la désinformation

 

Inscrivez-vous

 

logo

Pop’Sciences Mag : donnez-nous votre avis !

PPop’Sciences Mag : donnez-nous votre avis !

Énergies, Océans, Émotions, Tourisme …  Depuis maintenant 6 ans et 12 numéros, Pop’Sciences Mag se saisit de grandes thématiques sociétales, pour les éclairer par le regard pluridisciplinaire de nombreux chercheurs et experts.

Vous êtes les lecteurs de Pop’Sciences Mag et, en ce sens, les garants de notre ligne éditoriale. Dans une perpétuelle quête d’améliorations de notre magazine, nous souhaitons recueillir votre avis !

Nous vous proposons ainsi de répondre à un questionnaire, qui vous prendra environ 10 minutes.

Nous vous remercions par avance de vos réponses, qui nous seront d’une grande utilité pour continuer à vous proposer un contenu de qualité et qui corresponde à vos attentes.

Pour répondre à l’enquête :

CLIQUEZ-ICI

 

Retrouvez toute la collection des Pop’Sciences Mag ici.

Journée thématique : Amour et intelligence artificielle

JJournée thématique : Amour et intelligence artificielle

Après l’avènement des sites de rencontres il y a une vingtaine d’années, c’est au tour de l’intelligence artificielle de venir bouleverser les relations humaines et amoureuses. Nous sommes maintenant des millions à utiliser applications, chatbot ou robots sociaux et pour certains d’entre nous à en tomber amoureux… Aussi foisonnante et attrayante soit-elle, cette offre numérique soulève de nombreuses questions éthiques et comportementales.

Au programme :

  • à 14h, projection de Her de Spike Jonze, 2014, 2h06min (VOSTRFR)
  • à 16h15, table ronde sur le thème « Amour et intelligence artificielle : quelles réalités et quels futurs ? « 

Rendez-vous en écho à l’exposition À nos amours

Plus d’informations sur le site du :

MUSÉE DES CONFLUENCES

La scientific game jam du musée des Confluences

LLa scientific game jam du musée des Confluences

Les « Scientific Game Jams » sont des rassemblements de scientifiques et de concepteurs de jeux vidéo. Leur défi : créer des jeux vidéo scientifiques en 48h ! De l’ethnologie à l’astrophysique, toutes les sciences sont abordées pour proposer une approche originale, ludique et accessibles à tous…

En 2024, le musée organise sa première « Scientific Game Jam » autour de thématiques liées à ses collections et ses expositions. Rendez-vous au musée le 1er juin pour la phase finale de ce hackathon : la présentation des jeux et la remise des prix !

Une journée en partenariat avec l’association « La science entre en jeu »

Au programme :

  • de 14h à 17h : animation « Viens jouer avec la science ! »
  • de 17h à 18h : cérémonie de remise des prix (12 ans et +)

Plus d’informations sur le site du :

MUSÉE DES CONFLUENCES

L’IA générative pourrait aussi servir à exploiter des données personnelles en tout sécurité : la piste des données synthétiques | The Conversation

LL’IA générative pourrait aussi servir à exploiter des données personnelles en tout sécurité : la piste des données synthétiques | The Conversation

Comment réagiriez-vous si ChatGPT dévoilait votre numéro de téléphone et votre adresse privée ?

Parmi les données présentes sur le Web sur lesquelles le modèle de langage derrière ChatGPT s’entraîne, certaines informations sont personnelles et ne sont pas censées être révélées. Pourtant, ce risque est bien réel, comme l’a démontré une équipe de chercheurs, en poussant ChatGPT à révéler une grande quantité de données personnelles à partir d’une simple requête.

Pour garantir la confidentialité des données qui servent à entraîner les systèmes d’intelligence artificielle, une piste est d’utiliser des « données synthétiques » : des données fictives générées artificiellement qui conservent des propriétés statistiques du jeu de données réelles qu’elles cherchent à imiter et remplacer.

Avec des données synthétiques, on peut entraîner un système de classification ou un agent conversationnel comme ChatGPT, tester des logiciels, ou partager les données sans souci de confidentialité : des données synthétiques reproduisent par exemple les données du système national de données de santé.

Certaines des entreprises présentes sur le marché de la génération de données synthétiques, ainsi qu’une partie de la littérature académique, avancent même qu’il s’agit de données réellement anonymes. Ce terme est fort, car il sous-entend qu’on ne peut pas remonter aux données réelles – et donc, à votre numéro de sécurité sociale ou de téléphone.

En réalité, la synthèse de données possède des faiblesses et les garanties mises en avant font encore l’objet d’études.

Pourquoi tant d’engouement pour les données synthétiques ?

La synthèse de données permettrait de publier des données représentatives des données réelles d’origine mais non identifiables.

Par exemple, des données de recensement de la population peuvent être extrêmement utiles à des fins de statistiques… mais elles rassemblent des informations sur les individus qui permettent leur réidentification : leur publication en l’état n’est donc pas permise par le RGPD (Règlement général sur la protection des données).

Dans le cas de données personnelles ou de données soumises à propriété intellectuelle, ce procédé permettrait aussi de s’affranchir du cadre réglementaire qui limite souvent leur publication ou leur utilisation.

Il permettrait également de réaliser des expérimentations qui auraient demandé de coûteuses collectes de données, par exemple pour entraîner des voitures autonomes à éviter les collisions.

Enfin, les données synthétiques ne nécessitent pas de nettoyage des données. Cet atout est particulièrement important pour l’entraînement de modèles d’IA, où la qualité de l’annotation des données a un impact sur les performances du modèle.

Pour ces raisons, fin 2022, le marché mondial de la génération de données synthétiques avait déjà généré 163,8 millions de dollars et devrait connaître une croissance de 35 % de 2023 à 2030. L’adoption pourrait être rapide et massive, et représenter selon certaines études jusqu’à 60 % des données utilisées pour l’entraînement des systèmes d’IA en 2024.

La confidentialité est l’un des objectifs de la génération de données synthétiques, mais ce n’est pas le seul. Les acteurs du domaine entendent également profiter de l’exhaustivité des données synthétiques – qui peuvent être générées en quantité quasi illimitée et reproduire toutes les simulations envisagées, mais aussi permettre d’avoir des données sur des cas particulièrement difficiles avec des données réelles (comme la détection d’armes sur une image, ou une simulation de trafic routier avec des conditions bien particulières).

Comment génère-t-on des données synthétiques ?

Imaginons que nous voulons générer des données synthétiques comme l’âge et le salaire d’une population. On modélise d’abord la relation entre ces deux variables, puis on exploite cette relation pour créer artificiellement des données satisfaisant les propriétés statistiques des données d’origine.

Si la synthèse de données était initialement basée sur des méthodes statistiques, les techniques sont aujourd’hui plus élaborées, afin de synthétiser des données tabulaires ou temporelles – voire, grâce à des IA génératives, des données de type texte, images, voix et vidéos.

De fait, les techniques utilisées pour synthétiser des données à des buts de confidentialité sont très similaires à celles utilisées par les IA génératives comme ChatGPT pour le texte, ou StableDiffusion pour les images. En revanche, une contrainte supplémentaire liée à la reproduction de la distribution statistique des données source est imposée aux outils afin d’assurer la confidentialité.

Par exemple, les réseaux antagonistes génératifs (ou GANs pour generative adversarial networks) peuvent être utilisés pour créer des deepfakes.

schéma d’un réseau GAN

©Vincent Barra, The Conversation Fonctionnement schématique d’un réseau antagoniste génératif, ou GAN : l’idée de base des GANs est d’opposer deux réseaux de neurones distincts, le générateur et le discriminateur. Tandis que le générateur crée de nouvelles données, le discriminateur évalue la qualité de ces données. Les deux réseaux s’entraînent en boucle, améliorant ainsi leurs performances respectives. Le processus se termine lorsque le discriminateur ne parvient plus à discerner des données réelles de celles issues du générateur.

De leur côté, les auto-encoders variationnels (ou VAEs), compressent les données d’origine dans un espace de dimension inférieure et tentent de modéliser la distribution de ces données dans cet espace. Des points aléatoires sont ensuite tirés dans cette distribution et décompressés afin de créer de nouvelles données fidèles aux données d’origine.

 

Il existe d’autres méthodes de génération. Le choix de la méthode dépend des données sources à imiter et de leur complexité.

Données réelles vs données synthétiques : trouver les différences

La modélisation des données d’origine, sur laquelle repose le procédé de synthèse, peut être imparfaite, erronée ou incomplète. Dans ce cas, les données de synthèse ne reproduiront que partiellement les informations d’origine : on parle d’une « perte d’utilité ».

Au-delà d’une perte en performance, un générateur de données mal entraîné ou biaisé peut aussi avoir un impact sur des groupes minoritaires, sous représentés dans l’ensemble de données d’entraînement, et par conséquent moins bien assimilés par le modèle.

©Jill-Jênn Vie et Antoine Boutet, traduite par les auteurs, Fourni par l’auteur Exemple de génération de données synthétiques fidèles aux données d’entraînement à gauche, et qui ne reproduisent pas fidèlement les données d’entraînement à droite. Les données sont représentées ici par une analyse en « composantes principales », un type d’analyse statistique matricielle très répandu dans le monde des données.

La perte en utilité est un risque d’autant plus inquiétant que seul l’organisme à la source de la synthèse est en mesure de l’estimer, laissant les utilisateurs des données dans l’illusion que les données correspondent à leurs attentes.

Données synthétiques vs données anonymes : quelle garantie en termes de confidentialité ?

Lorsque le partage de données personnelles n’est pas permis, des données personnelles doivent être anonymisées avant d’être partagées. Toutefois l’anonymisation est souvent difficile techniquement, voire même impossible pour certains jeux de données.

Les données synthétiques se placent alors en remplacement des données anonymisées. Cependant, comme pour les données anonymisées, le risque zéro n’existe pas.

 

Bien que l’ensemble des données sources ne soit jamais révélé, les données de synthèse, et parfois le modèle de génération utilisé, peuvent être rendus accessibles et ainsi constituer de nouvelles possibilités d’attaques.

Pour quantifier les risques liés à l’utilisation des données synthétiques, les propriétés de confidentialité sont évaluées de différentes façons :

schéma expliquant le principe d’une attaque par appartenance

©Image de E. De Cristofaro, traduite par les auteurs, Fourni par l’auteur Principe d’une attaque par appartenance.

Des risques non nuls

Il est important de comprendre que dans la plupart des cas, le risque de fuite d’information n’est pas binaire : la confidentialité n’est ni totale ni nulle.

Le risque est évalué au travers des distributions de probabilité en fonction des hypothèses, des données et des menaces considérées. Certaines études ont montré que les données synthétiques offrent peu de protection supplémentaire par rapport aux techniques d’anonymisation. De plus, le compromis entre confidentialité des données d’origine et utilité des données synthétiques est difficile à prévoir.

Certaines mesures techniques permettent de renforcer la confidentialité et de réduire les risques de réidentification. La confidentialité différentielle notamment est une solution prometteuse, encore à l’étude afin de fournir des garanties suffisantes en termes d’utilité des données, de coût computationnel et d’absence de biais.

Il faut tout de même noter que si les risques liés à l’utilisation de données de synthèse ne sont pas nuls, leur utilisation peut s’avérer avantageuse pour certains scénarios d’utilisation. Par exemple, on peut calibrer la génération pour qu’elle conserve uniquement certaines propriétés des données sources pour limiter les risques.

Comme pour n’importe quelle solution de protection à mettre en place, il est toujours nécessaire de faire une analyse de risques pour objectiver ses choix. Et bien sûr, la génération de données synthétiques soulève aussi des enjeux éthiques lorsque la génération des données a comme finalité de construire de fausses informations.

Les auteurs :

Antoine Boutet, Maitre de conférence, Privacy, IA, au laboratoire CITI, Inria, INSA Lyon – Université de Lyon,

Alexis Leautier, Ingénieur Expert au Laboratoire d’innovation numérique, CNIL

Le PEPR Cybersécurité et son projet IPoP (ANR-22-PECY-0002) sont soutenus par l’Agence nationale de la recherche (ANR), qui finance en France la recherche sur projets. Elle a pour mission de soutenir et de promouvoir le développement de recherches fondamentales et finalisées dans toutes les disciplines, et de renforcer le dialogue entre science et société. Pour en savoir plus, consultez le site de l’ANR.The Conversation

Cet article est republié à partir de The Conversation sous licence Creative Commons.

>> Pour lire l’article original, rendez-vous sur le site :

The conversation.

« Qu’est-ce que l’apprentissage profond? » | Printemps du numérique 2024

«« Qu’est-ce que l’apprentissage profond? » | Printemps du numérique 2024

Dans le cadre du Printemps du Numérique 2024, embarquez pour un voyage captivant au cœur de l’intelligence artificielle avec notre conférence sur le deep learning.

Depuis une dizaine d’années, l’apprentissage automatique et en particulier le deep learning a permis de nombreux progrès en intelligence artificielle pour de nombreuses applications (reconnaissance et générations d’images, compréhension de traduction de texte, …). Quels sont leur principe de fonctionnement? Ressemblent-ils à notre cerveau? Quelles sont leur limites? Lors de cette conférence, Mathieu Lefort, enseignant-chercheur et maître de conférences à l’Université Claude Bernard Lyon 1, partagera son expertise afin de répondre à ces interrogations.

Pour en savoir plus :

BM Part Dieu

 

Bertin Nahum : quand l’ingénierie sauve des vies | Visages de la science

BBertin Nahum : quand l’ingénierie sauve des vies | Visages de la science

Bertin Nahum fait partie des innovateurs les plus brillants de sa génération. Père des robots chirurgicaux made in France, ce visionnaire imagine la médecine de demain. Après avoir conçu un robot destiné à la chirurgie du genou, puis un deuxième pour la chirurgie du cerveau, cet ingénieur s’attaque aujourd’hui, avec un nouveau prototype, à la lutte contre le cancer du foie. Animé par la volonté de se sentir utile et de rendre l’acte chirurgical plus sûr, il s’efforce aussi de faire connaître au monde entier, l’excellence des technologies médicales françaises.

  • Réduire les aléas

« Quand j’ai commencé à travailler dans ce secteur-là, j’ai été très étonné de voir que la chirurgie était une discipline très artisanale. La robotique est en mesure de faire ce qu’elle a fait dans plein de secteurs de la vie quotidienne : réduire les aléas. Il ne s’agit pas de remplacer le praticien mais d’optimiser l’acte chirurgical en le rendant plus précis et plus fiable. »

  • Des robots révolutionnaires

Après avoir occupé des postes de terrain, Bertin Nahum a été confronté à la réalité et à la pratique sur la façon dont la technologie pouvait répondre aux besoins des chirurgiens. Visionnaire, il s’est fait père de robots chirurgicaux révolutionnaires. « Nos robots sont des outils intelligents. Ils utilisent des images pour planifier un acte chirurgical ; aident à la décision du praticien ; puis assistent la réalisation dans le geste à proprement dit. Ils utilisent de l’imagerie, de l’intelligence artificielle et de la robotique. »

  • De l’importance du made-in-France

« La prochaine révolution numérique se fera dans le secteur de la santé. Les robots et l’intelligence artificielle pénétreront dans ce secteur. Cependant, quand on touche à la santé de gens, il faut s’assurer que cette activité ne reproduise pas ce qu’il s’est passé jusque-là avec les GAFA. Il est important que l’Europe se saisisse du sujet. »

 

Portrait de Bertin Nahum

Diplômé de l’INSA Lyon, Bertin Nahum a été sacré quatrième entrepreneur high-tech le plus révolutionnaire du monde par la revue canadienne Discovery en 2012, juste derrière Steve Jobs, Mark Zuckerberg et James Cameron. Il était l’invité du podcast « Les cœurs audacieux », un contenu audio proposé par l’INSA Lyon (Saison 2 – Épisode 1).

 

ÉCOUTER L’ÉPISODE