Building a reliable 16S mini-barcode library of wild bees from Occitania, south-west of France
Magalie Pichon et Anaïs Marquisseau, en tant que correspondantes de ce papier, ont profité du numéro spécial "Pollinators of France and French overseas territories" dans Biodiversity Data Journal, dans lequel un autre datapaper dynaforien sur la base abeille est déjà paru (Ollivier et al, 2024), pour publier, avec d'autres collègues De Dynafor et d'autres unités INRAE, un datapaper sur la base de barcodes 16S d’abeilles sauvages d’Occitanie. Les individus barcodés proviennent de la base abeille et de la collection de Rémi Rudelle (+30 bourdons du CRBE). Au total, 348 barcodes validés par identification morphologique et couvrant 148 espèces ont été mis à disposition sur la base mondiale de barcodes BOLD. Parmi ces 148 espèces, 93 n’avaient pas de référence 16S dans les bases de données. Ce travail contribue donc à l’enrichissement des bases de barcodes, essentielles aux analyses de métabarcoding/ADNe.
Marquisseau A, Canale-Tabet K, Labarthe E, Pascal G, Klopp C, Pornon A, Escaravage N, Rudelle R, Vignal A, Ouin A, Ollivier M, Pichon M (2025) Building a reliable 16S mini-barcode library of wild bees from Occitania, south-west of France. Biodiversity Data Journal 13: e137540. https://doi.org/10.3897/BDJ.12.e137540
Abstract:
Background
DNA barcoding and metabarcoding are now powerful tools for studying biodiversity and especially the accurate identification of large sample collections belonging to diverse taxonomic groups. Their success depends largely on the taxonomic resolution of the DNA sequences used as barcodes and on the reliability of the reference databases. For wild bees, the barcode sequences coverage is consistently growing in volume, but some incorrect species annotations need to be cared for. The COI (Cytochrome Oxydase subunit 1) gene, the most used in barcoding/metabarcoding of arthropods, suffers from primer bias and difficulties for covering all wild bee species using the classical Folmer primers.
New information
We present here a curated database for a 250 bp mini-barcode region of the 16S rRNA gene, suitable for low-cost metabarcoding wild bees in applications, such as eDNA analysis or for sequencing ancient or degraded DNA. Sequenced specimens were captured in Occitania (south-west of France) and morphologically identified by entomologists, with a total of 530 individuals belonging to 171 species and 19 genera. A customised workflow including distance-tree inferences and a second round of entomologist observations, when necessary, was used for the validation of 348 mini-barcodes covering 148 species. Amongst them, 93 species did not have any 16S reference barcode available before our contribution. This high-quality reference library data are freely available to the scientific community, with the aim of facilitating future large-scale characterisation of wild bee communities in a context of pollinators' decline.
Résumé:
Contexte
Le barcoding et le metabarcoding de l’ADN sont aujourd'hui des outils moléculaires puissants pour l'étude de la biodiversité et en particulier pour l'identification précise de grandes collections d'échantillons appartenant à divers groupes taxonomiques. Leur succès dépend largement de la résolution taxonomique des régions d'ADN ciblées et de la fiabilité des bases de données de référence. Pour les abeilles sauvages, la couverture des barcodes augmente constamment en volume, mais certaines annotations d'espèces incorrectes doivent être corrigées. Le gène COI (sous-unité 1 de la cytochrome oxydase), marqueur le plus utilisé dans le barcoding/metabarcoding des arthropodes, souffre d'un biais se traduisant par des difficultés à couvrir toutes les espèces d'abeilles sauvages à l'aide des amorces classiques de Folmer.
Nouvelles informations
Nous présentons ici une base de données fiable pour une région mini-barcode de 250 pb du gène de l'ARNr 16S, adaptée au metabarcoding à faible coût des abeilles sauvages dans des applications telles que l'analyse de l'ADN environnemental ou le séquençage de l'ADN ancien ou dégradé. Les spécimens séquencés ont été capturés en Occitanie (sud-ouest de la France) et identifiés morphologiquement par des entomologistes, avec un total de 530 individus appartenant à 171 espèces et 19 genres. Un processus de vérification comprenant des inférences d'arbres de distance et une deuxième série d'observations par des entomologistes, si nécessaire, a été utilisé pour la validation de 348 mini-barcodes couvrant 148 espèces. Parmi celles-ci, 93 espèces ne disposaient d'aucune référence 16S avant notre contribution. Ces données de référence de haute qualité sont mises à la disposition de la communauté scientifique, dans le but de faciliter la caractérisation future à grande échelle des communautés d'abeilles sauvages dans un contexte de déclin des pollinisateurs.
Comments