L’analyse des sols par les capteurs : la qualité de nos résultats se trouve dans notre base de données.

 

AgroCares est souvent confronté à des questions concernant la qualité des résultats de notre technologie d’analyse des sols. Mais qu’est-ce que la qualité ? et quand la qualité est-elle assurée ? Christy van Beek, agronome en chef chez AgroCares, partage son point de vue sur la question.

Après 17 ans de recherche à l’université et au centre de recherche de Wageningen, j’ai rejoint SoilCares (aujourd’hui AgroCares) fin 2017. C’était une opportunité à laquelle je n’ai pas pu résister ; il semblait que c’était ma seule chance de mettre mes connaissances scientifiques en pratique.

AgroCares développe une technologie de test de sol utilisant des données de capteurs. Il m’a semblé que c’était le changeur de jeu qui pouvait apporter des informations sur les sols aux mains des agriculteurs. Notamment, l’information n’est-elle pas le prédécesseur de la motivation et ne conduit-elle pas à la mise en œuvre ?

C’était un peu étonnant de constater que vendre l’équipement est plus difficile que je ne le pensais. Appelez ça être naïf, mais je pensais qu’une telle innovation se vendrait toute seule. Pourtant, les clients potentiels nous posent presque toujours des questions sur la qualité.

Et c’est là que commence le plaisir … Qu’est-ce que la qualité ? et quand la qualité est-elle assurée ? Quand cela équivaut à des résultats de laboratoire de chimie par voie humide ? Bien sûr que non. De nombreuses études ont confirmé l’écart relativement élevé entre les laboratoires conventionnels pour des échantillons de sol similaires et des programmes de test de compétence à l’échelle mondiale ont été mis en place pour surveiller les différences entre les laboratoires de traitement du sol (voir par exemple WEPAL).

Ainsi, exiger un « bon accord » avec un laboratoire conventionnel aléatoire revient à demander à la technologie AgroCares de toucher une cible en mouvement. En raison de cet écart entre différents laboratoires conventionnels, AgroCares a décidé d’analyser tous les échantillons d’étalonnage dans notre propre laboratoire, que nous (je dois admettre que c’est un peu reniflant) que nous appelons le « laboratoire de référence standard ». Nous analysons tous les échantillons dans ce laboratoire, non pas parce que nous pensons qu’il est tellement meilleur que d’autres laboratoires (mais aussi pas pire), mais parce que c’est le même laboratoire.

Dans le GSL, tous les échantillons sont analysés pour 93 paramètres. Ces paramètres incluent des éléments chimiques, mais également une gamme d’autres paramètres tels que la texture, la CE et le pH. Pour tous ces éléments, un modèle statistique est exécuté pour rechercher les corrélations entre les valeurs du GSL et les résultats du laboratoire de capteurs, c’est-à-dire le spectrographe. Je sous-estime certainement mes collègues du département de la recherche lorsque je parle de « modèle statistique » … j’ai eu ma part de statistiques, mais c’est bien au-delà de ma compréhension, en particulier lorsque le «machine learning» est en place. Ce qui est important, c’est qu’en fin de journée (ou mieux ; en fin de semaine, car ce calcul prend une à deux semaines), des algorithmes sont développés qui permettent de prédire les valeurs du GSL à partir du spectrographe. . Il n’est donc pas surprenant que tous les paramètres ne disposent pas d’un modèle de prévision identique, certains étant plutôt redoutables. Ainsi, sur ces 93 éléments, seuls entre 30 et 49 paramètres sont validés, c’est-à-dire qu’ils répondent aux critères de qualité.

Si des clients potentiels souhaitent utiliser nos produits dans un pays non encore étalonné, nous devons discuter du processus d’étalonnage. C’est souvent une discussion difficile et tout dépend du niveau de connaissances de mon homologue, que nous le finissions ou non.

Une base de données mondiale avec représentation locale

AgroCares dispose d’une base de données mondiale sur les sols. Cela signifie que toutes les données, partout dans le monde, sont stockées dans une base de données et que les algorithmes (modèles de prédiction) utilisent toutes les données. Alors, que se passe-t-il lorsqu’un sol est échantillonné et que le spectre est envoyé au nuage pour analyse ?

Fondamentalement, il entre dans le modèle de prévision, qui examine les pentes, les pics et les vallées du spectre et les spectres voisins. Un spectre voisin n’est pas un voisin géographique, mais un spectre qui présente des similitudes avec le spectre considéré.

Les informations du spectre actuel et les spectres d’étalonnage voisins sont utilisés pour trouver les meilleures prédictions. Dans le cas du LiaB, les informations provenant de XRF et de MIR sont également convergées pour améliorer les prévisions.

Lorsqu’un nouveau pays est étalonné, il n’est pas nécessaire de dupliquer les spectres existants, mais comment savoir si le spectre d’un nouveau pays est déjà présent dans la base de données ou non ? Eh bien, nous ne savons pas, mais nous pouvons estimer. Le spectre d’un échantillon de sol dépend par exemple de géologie, climat et utilisation des sols. Dans notre procédure d’étalonnage, nous recherchons des combinaisons de ces facteurs qui ne sont pas encore couverts. Parfois, l’estimation résultant de notre procédure est que seul un nombre limité d’échantillons est nécessaire. Cela se produit par exemple pour les pays voisins (et maintenant je parle de voisins physiques). Mais il arrive aussi qu’un certain nombre ait été estimé, mais, une fois l’étalonnage terminé, les critères de libération n’étaient pas encore remplis et nous devions revenir en arrière pour prélever davantage d’échantillons. En conséquence, la quantité d’échantillons d’étalonnage est plus élevée pour les pays qui ont été étalonnés en premier lieu que pour ceux qui ont suivi.

Couvrir tous les spectres du monde

Par conséquent, à un moment donné, la base de données d’étalonnage d’AgroCares aura couvert tous les spectres possibles dans le monde. Lorsque nous atteignons ce stade, nous avons terminé le calibrage et la technologie peut être utilisée n’importe où. Ce point n’est peut-être pas si loin. La base de données d’étalonnage contient actuellement 14 000 échantillons, ce qui correspond à 21 mises à jour de la base de données d’étalonnage. Notamment, la base de données d’étalonnage est mise à jour chaque mois. Depuis la mise à jour 8, les performances du modèle de prévision (figure 2) sont à peine améliorées, ce qui indique que nous atteignons le point de saturation. Ce concept explique également pourquoi nous avons besoin de moins d’échantillons pour calibrer la Côte d’Ivoire par rapport au Kenya (qui ont à peu près la même taille) pour atteindre le même niveau de précision. Le Kenya a été calibré avant la Côte d’Ivoire.

Nous nous attendons à atteindre le calibrage mondial à 30000 échantillons. Avec la vitesse actuelle de 150 échantillons par semaine, nous sommes dans les 3 ans.