Introduction à l'utilisation du numérique en SVT
Cet article introduit le point de départ de la réflexion menée par le groupe de travail ainsi que la porte d'entrée par laquelle aborder l'intégration du numérique en SVT. Les différents travaux du groupes sont regroupés sous 4 catégories :
Utilisation des données scientifiques en SVT
2. Données scientifiques et bases de données scientifiques : De quoi parle-t-on ?
3. Intégrer les bases de données scientifiques dans les séquences d'enseignement
4. Les axes de travail du groupe numérique en SVT
1. L'intégration des données et bases de données scientifiques en SVT, une nécessité dans un contexte global
Les données numériques sont un enjeu de société essentiel à l'heure actuelle.
Elles posent des questions de divers ordres :
- d'ordre technique : format des données, traitement des données, …
- d'ordre éthique : protection des données, fake news, …
- d'ordre environnemental : Consommation énergétique du stockage des données, …
Ces questions sont largement transversales, elles sont mises en place dans les programmes officiels de nombreuses disciplines qu'elles soient scientifiques ou non. Les données scientifiques correspondent à une partie des données numériques résultant de l'accumulation d'informations scientifiques de diverses natures. Elles sont soumises au même questionnement que les autres données numériques.
Pour les SVT, l'utilisation des données scientifiques est définie dans le préambule des programmes et se trouve ensuite déclinée dans différentes parties du programme :
Extrait du préambule de programme de SVT du lycée de la 2de à la terminale :
Le numérique et les SVT
Les SVT requièrent l’usage des outils numériques généralistes (Internet, tableurs) et le recours à l’expérimentation assistée par ordinateur, qui peut se prolonger par l’exploitation de capteurs connectés à des microcontrôleurs programmables. Elles doivent aussi développer de nouvelles compétences numériques chez les élèves : l’usage des bases de données scientifiques, de systèmes d’informations géoscientifiques, de la modélisation numérique, de la programmation, des calculs quantitatifs, voire de la réalité virtuelle et de la réalité augmentée. Ce sont autant de possibilités offertes aux lycéens de manipuler les outils actuels des sciences du vivant et de la Terre, qui leur ouvrent de nouvelles perspectives de formation, comme la bio-informatique ou l’exploitation de données.
Les programmes de lycée de la seconde à la terminale (publiée en 2018 et 2019) font explicitement référence à la nécessité de développer l'utilisation des données scientifiques dans le cadre de l'enseignement des SVT. Il s'agit d'une exigence forte du programme officiel puisque exprimée dans le préambule des programmes et s'applique ainsi à l'ensemble des programmes et peut potentiellement être déclinée dans chaque partie du programme.
De la même manière on retrouve la déclinaison de cette problématique dans les programmes de mathématiques et de sciences physiques. De nouvelles disciplines sont également apparues pour répondre à cet enjeu fort comme les SNT (Sciences du Numérique et Technologie) en seconde pour donner aux élèves une culture générale dans ce sens et la spécialité NSI (Numérique et Sciences Informatiques) pour permettre aux élèves qui le souhaitent de développer des compétences fortes dans ce domaine.
Cet article vise à donner du sens à l'utilisation des données scientifiques que l'on peut avoir en classe.
Nous ferons d'abord le point sur l'utilisation des données scientifiques et montrerons que les données scientifiques sont déjà très présentes et très utilisées en SVT et cela depuis très longtemps.
Quelques ajustements dans leur utilisation peuvent alors permettre de se conformer à l'esprit actuel du programme. Pour cela il suffit d'explicitement identifier les données utilisées en plus des usages déjà largement présent dans l'enseignement des SVT. Des exemples de cette démarche sont développés un peu plus loin.
On proposera ensuite de nouvelles pistes d'intégration de l'utilisation des données scientifiques à partir d'outils encore moins utilisés en classe et qui complètent l'arsenal des possibilités.
2. Données scientifiques et bases de données scientifiques : De quoi parle-t-on ?
Définissons sommairement les objets de cet article.
Les données scientifiques sont des informations obtenues à partir de divers outils et par différentes méthodes. Leur accumulation nécessite de développer des normes et des règles qui permettront de les stocker, de les retrouver et de les traiter. On parlera alors de données structurées, une notion que les élèves de seconde auront pu aborder en SNT.
"Une donnée est une valeur décrivant un élément digne d’intérêt pour celui qui choisit de la conserver. Plusieurs descripteurs peuvent être utiles pour décrire un même élément " Extrait de programme SNT-2de
Par exemple, un gène est une donnée qui peut être décrite par sa séquence, le chromosome qui le porte, l'organisme qui le porte, …
Les bases de données scientifiques sont des systèmes qui permettent de conserver et de partager les données. Cela nécessite des conventions, des normes, des règles pour homogénéiser la description des données et définit alors un format de données. Chaque domaine disciplinaire définit ces conventions en fonction de ses usages. Par exemple, la genbank est une base de données internationale qui stocke les données de séquences liées aux gènes et les rend disponibles.
Une description de quelques formats de données est proposée en annexe de ce document.
Les données scientifiques numériques sont utilisées en SVT depuis longtemps.
"Par ma foi ! il y a plus de quarante ans que je dis de la prose sans que j’en susse rien, et je vous suis le plus obligé du monde de m’avoir appris cela."
Molière : Le Bourgeois gentilhomme, Acte II, scène 1.
Un usage banal des données scientifiques en SVT
Dès l'introduction de l'informatique dans l'enseignement de SVT des données scientifiques ont été utilisées et dès l'arrivée de l'Internet des banques de données scientifiques ont été accessibles et utilisées. Cet usage n'a pas cessé de se développer depuis et les enseignants de SVT utilisent les données scientifiques très régulièrement en classe avec leurs élèves.
Il peut s'agir de l'utilisation d'un tableur pour traiter des données ou des mesures comme par exemple le calcul de la vitesse de déplacement d'une plaque à partir de mesures de GPS ou encore le tracé d'un graphique par un logiciel d'ExAO.
Mais il s'agit principalement de la mise en œuvre de logiciels dédiés à un domaine particulier accompagnés de données pouvant être directement utilisées à partir des fonctionnalités des logiciels. Le tableau ci-dessous donne quelques exemples de ces logiciels illustrant les usages et leurs diversités.
Quelques logiciels courants en SVT utilisant des données scientifiques (liste non exhaustive).
Chaque enseignant de SVT se reconnaîtra, sans doute, au moins dans l'une ou l'autre de ces utilisations, sinon dans plusieurs. Cela démontre bien la banalisation déjà ancienne de l'utilisation des données scientifiques dans l'enseignement des SVT.
3. Intégrer les bases de données scientifiques dans les séquences d'enseignement
A. Adapter les usages répandus aux programmes actuels, une première approche immédiate
Quelles sont les exigences liées aux programmes actuels ? Les programmes demandent de manipuler ces nouveaux outils pour notamment exploiter les données. Comme cela vient d'être développé c'est déjà le cas mais le plus souvent l'utilisation des données scientifiques est basée sur la signification biologique ou géologiques des données, leur nature numérique étant gommée.
Les élèves travaillent sur la fonction des gènes, sur la répartition ou le trajet d'un séisme, …
Ils utilisent les données sans se préoccuper de leur nature numérique. C'est à ce niveau là qu'à minima une prise de conscience peut se développer pour découvrir la donnée utilisée.
La donnée n'est pas un objet magique (en général un fichier) mais une construction structurée par des règles préétablies (normes) qui a été obtenue à partir d'une technique de mesure particulière. Cela permet alors de s'en servir tout en maîtrisant les limites de cette utilisation.
Pour obtenir ce résultat il peut suffire de présenter un exemple de donnée couramment utilisée pour constater sa structure et percevoir à ce stade les possibilités de manipulation que cela autorise. Par exemple éditer un fichier edi pour Anagène/Geniegen ou un fichier pdb pour Rastop/Libmol permettra de constater comment la donnée est structurée (voir l'annexe).
Ce constat permet déjà d'ouvrir partiellement la boite noire que constitue l'utilisation courante qui est faite des logiciels. Et au-delà cela peut permettre de mobiliser ou remobiliser les connaissances des élèves sur les données structurées abordées en SNT et encore d'aborder le traitement automatique de ces données c’est-à-dire les notions d'algorithmique (développés dans un autre article).
Observer la structure d'un fichier de données permet donc déjà de se conformer aux attentes des programmes actuels sans nécessité d'investissement supplémentaire et peut constituer pour les enseignants une première réponse aux attentes actuels des programmes.
B. Développer de nouveaux usages des données scientifiques numériques en SVT.
On a perçu dans la partie précédente que l'utilisation des données numériques nécessite de trouver un équilibre entre des outils permettant :
- soit une approche rapidement opérationnelle centrée sur les mécanismes étudiés (biologiques ou géologiques) mais fonctionnant davantage comme des boites noires,
- soit une approche centrée sur les données et qui nécessite des compétences spécifiques dans la manipulation des données mais qui permet une approche plus critique puisqu'elle nécessite d'évaluer les données à traiter.
Il s'agit de trouver un équilibre entre ces deux approches.
La première approche déjà largement en usage. De nouveaux logiciels toujours conçus à partir de données présélectionnées sont disponibles et donnent accès à toujours davantage de données et d'outils d'exploitation performants comme par exemple Anagène ou Tectoglob3D. Dans l'esprit des nouveaux programmes, s'ils sont toujours très intéressants parce qu'ils permettent un accès opérationnel immédiat au traitement des données, il continue à fonctionner comme des boites noires et il s'agit d'entrouvrir au moins cette boite noire. C'est parfois possible (voir partie A) mais parfois, au lycée, le seul accès possible à des données de structures complexes comme par exemple celle de l'imagerie médicale reste le logiciel dédié (Eduanat2).
Avec le développement des banques de données numériques scientifiques au cours du temps, sont également apparus de nouveaux outils de manipulation des données. Ils sont de différentes natures :
- Des outils associés directement aux bases de données et fonctionnant de manière intégrée comme par exemple l'outil BLAST en génétique et bio-informatique ou les visualisateurs de données géoscientifiques (Geoportail, Infoterre). Un outil comme Libmol est directement interfacé avec plusieurs bases de données comme la Protein Data Bank ou la "Librairie de molécules".
- Des outils généralistes basés sur la manipulation des données dès lors qu'elles sont disponibles. Ce sont principalement les tableurs (Libre office Calc, MS Excel ou Google Sheet ou encore Latis) qui permettent de traiter les données brutes pour en tirer des informations utiles.
- Des outils intermédiaires, présentant des fonctionnalités de traitement spécialisées dans un domaine particulier à partir de données disponibles. C'est le cas d'outils comme Libmol (ou Rastop) pour le traitement de fichiers moléculaires disponibles mais aussi de systèmes d'information géoscientifiques (SIG) comme par exemple Qgis ou ArcGis pour l'étude de données géolocalisées (Sismologie, Epidémiologie, Biodiversité, ...)
Le point commun à tous ces outils est qu'ils font appel à des méthodes automatiques de traitement des données, c’est-à-dire à l'algorithmique. Ainsi il est envisageable d'aborder ce domaine scientifique et de développer les compétences des élèves en la matière à travers des thématiques concrètes étudiées en SVT. Un développement qui conduit naturellement à la programmation qui correspond à la mise en œuvre effective des algorithmes.
Enfin à partir de l'algorithmique et de de la programmation qui en résulte, il devient possible de mettre en œuvre la dimension prédictive de l'utilisation des données, c'est le domaine de la modélisation. La modélisation qui permet de vérifier si les hypothèses explicatives envisagées sont cohérentes avec les données disponibles et ainsi de les valider ou de les invalider; et parfois, de prévoir l'évolution future d'un phénomène. Des outils de modélisation permettant de développer des scenarii sur la base de données disponibles comme par exemple Edumodèle ou NetBioDyn sont aujourd'hui disponibles en classe.
4. Les axes de travail du groupe numérique en SVT
Sur la base de cette réflexion plusieurs pistes de développement sont envisagées par le groupe de travail. Chaque article est étiqueté selon les prérequis nécessaires (prise en main, consolidation, autonomie), ce qui permet de construire une continuité dans les activités qui peuvent être proposées en classe ou bien de différencier le travail donné.
Les membres du groupe de travail : contacts groupe numérique