Chair objectives
La recherche sur l’intelligence artificielle éthique s’est principalement concentrée sur l’alignement des valeurs, lthe challenge of ensuring intelligent machines operate in accordance with human moral norms and values..
This approach assumes that moral norms are fixed, being either prescriptive, defined by experts, or descriptive, discovered through behavioral science.
Bien que cette perspective soit précieuse, elle limite également l’exploration du potentiel de l’IA à façonner les normes morales. De nouvelles recherches sont nécessaires pour prendre en compte la nature dynamique des normes morales et le rôle des machines intelligentes dans le renforcement, la remise en question ou la transformation de ces dernières. Le Centre pour l’intelligence artificielle morale morales (MoAI) vise à étudier l’impact des machines intelligentes sur les normes et les valeurs morales humaines en utilisant une approche multidisciplinaire qui combine la psychologie morale, l’économie expérimentale et l’informatique. Les projets MoAI commencent par identifier les valeurs morales susceptibles d’être affectées par une technologie et pourquoi, en s’inspirant de la psychologie morale. Ils utilisent ensuite l’économie expérimentale pour concevoir des protocoles compatibles avec les incitations afin de mesurer l’impact de la technologie sur ces valeurs.
Finally, computer science is employed to develop a simplified or prototyped version of the technology for use in experiments, with the added challenge that this technology often does not exist yet. This proactive approach will enable us to prepare society for upcoming technological shifts and guide AI development away from undesirable outcomes.
Research objectives
Main scientific outcomes
Research objectives
- Utilisation de l’IA pour la détection de la sincérité.
- Dénonciation des techniques de délégations à l’IA non-éthiques.
- Profilage moral de l’IA et systèmes de crédit social.
- Coopération avec l’IA.
- Authenticité de la communication faite par le biais de l’IA.
Main scientific outcomes
- Prédiction des normes morales émergentes pour l’interaction avec l’IA.
- Estimation de l’équilibre moral lors de la délégation à des machines.
- Identification des possibilités vers des systèmes de crédit social acceptables et non-acceptables.
- Estimation de la demande pour des filtres IA en temps réel lors de communications en ligne.