Toward Trustworthy AI Development: Mechanisms for Supporting Verifiable Claims

Miles Brundage; Shahar Avin; Jasmine Wang; Haydn Belfield; Gretchen Krueger; Gillian Hadfield; Heidy Khlaaf; Jingying Yang; Helen Toner; Ruth Fong; Tegan Maharaj; Wei Koh; Sara Hooker; Jade Leung; Andrew Trask; Emma Bluemke; Jonathan Lebensold; Cullen O'Keefe; Mark Koren; Théo Ryffel; J B Rubinovitz; Tamay Besiroglu; Federica Carugati; Jack Clark; Peter Eckersley; Sarah de Haas; Maritza Johnson; Ben Laurie; Alex Ingerman; Igor Krawczuk; Amanda Askell; Rosario Cammarota; Andrew Lohn; David Krueger; Charlotte Stix; Peter Henderson; Logan Graham; Carina Prunkl; Bianca Martin; Elizabeth Seger; Noa Zilberman; Seán Ó Héigeartaigh; Frens Kroeger; Girish Sastry; Rebecca Kagan; Adrian Weller; Brian Tse; Elizabeth Barnes; Allan Dafoe; Paul Scharre; Ariel Herbert-Voss; Martijn Rasser; Shagun Sodhani; Carrick Flynn; Thomas Krendl Gilbert; Lisa Dyer; Saif Khan; Yoshua Bengio; Markus Anderljung

Pré-Publication, Document De Travail Année : 2020

Toward Trustworthy AI Development: Mechanisms for Supporting Verifiable Claims

(1) , (2) , (3) , (2) , (1) , (1) , (4) , (5) , (6) , (7) , (8) , (9) , (10) , (11) , (7) , (7) , (12) , (1) , (9) , (13, 14) , (15) , (16) , (17) , (1) , (5) , (18) , (18) , (18) , (18) , (19) , (1) , (20) , (21) , (22) , (23) , (9) , (7) , (11) , (1) , (16) , (7) , (2) , (24) , (1) , (6) , (16) , (11, 5) , (1) , (7) , (25) , (1) , (25) , (22) , (6) , (26) , (5) , (6) , (22) , (11)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

Miles Brundage

Fonction : Auteur

OpenAI

Shahar Avin

Fonction : Auteur

Leverhulme Centre for the Future of Intelligence

Jasmine Wang

Fonction : Auteur
PersonId : 1085995

Montreal Institute for Learning Algorithms [Montréal]

Haydn Belfield

Fonction : Auteur

Leverhulme Centre for the Future of Intelligence

Gretchen Krueger

Fonction : Auteur
PersonId : 1085996

OpenAI

Gillian Hadfield

Fonction : Auteur

OpenAI

Heidy Khlaaf

Fonction : Auteur

Adelard

Jingying Yang

Fonction : Auteur

Partnership on AI

Helen Toner

Fonction : Auteur

Center for Security and Emerging Technology

Ruth Fong

Fonction : Auteur

University of Oxford

Tegan Maharaj

Fonction : Auteur

École Polytechnique de Montréal

Wei Koh

Fonction : Auteur

Stanford University

Sara Hooker

Fonction : Auteur

Google Brain

Jade Leung

Fonction : Auteur

Future of Humanity Institute

Andrew Trask

Fonction : Auteur

University of Oxford

Emma Bluemke

Fonction : Auteur

University of Oxford

Jonathan Lebensold

Fonction : Auteur

McGill University = Université McGill [Montréal, Canada]

Cullen O'Keefe

Fonction : Auteur

OpenAI

Mark Koren

Fonction : Auteur

Stanford University

Théo Ryffel

Fonction : Auteur
PersonId : 735640
IdHAL : theoryffel

Département d'informatique - ENS Paris

Construction and Analysis of Systems for Confidentiality and Authenticity of Data and Entities

J B Rubinovitz

Fonction : Auteur

Remedy

Tamay Besiroglu

Fonction : Auteur

University of Cambridge [UK]

Federica Carugati

Fonction : Auteur

Center for Advanced Study in the Behavioral Sciences

Jack Clark

Fonction : Auteur

OpenAI

Peter Eckersley

Fonction : Auteur

Partnership on AI

Sarah de Haas

Fonction : Auteur

Research at Google

Maritza Johnson

Fonction : Auteur

Research at Google

Ben Laurie

Fonction : Auteur

Research at Google

Alex Ingerman

Fonction : Auteur

Research at Google

Igor Krawczuk

Fonction : Auteur

Ecole Polytechnique Fédérale de Lausanne

Amanda Askell

Fonction : Auteur

OpenAI

Rosario Cammarota

Fonction : Auteur

Intel Corporation [USA]

Andrew Lohn

Fonction : Auteur

Rand Corporation

David Krueger

Fonction : Auteur

Université du Québec à Montréal = University of Québec in Montréal

Charlotte Stix

Fonction : Auteur

Eindhoven University of Technology [Eindhoven]

Peter Henderson

Fonction : Auteur

Stanford University

Logan Graham

Fonction : Auteur

University of Oxford

Carina Prunkl

Fonction : Auteur

Future of Humanity Institute

Bianca Martin

Fonction : Auteur

OpenAI

Elizabeth Seger

Fonction : Auteur

University of Cambridge [UK]

Noa Zilberman

Fonction : Auteur

University of Oxford

Seán Ó Héigeartaigh

Fonction : Auteur

Leverhulme Centre for the Future of Intelligence

Frens Kroeger

Fonction : Auteur

Coventry University

Girish Sastry

Fonction : Auteur

OpenAI

Rebecca Kagan

Fonction : Auteur

Center for Security and Emerging Technology

Adrian Weller

Fonction : Auteur

University of Cambridge [UK]

Brian Tse

Fonction : Auteur

Future of Humanity Institute

Partnership on AI

Elizabeth Barnes

Fonction : Auteur

OpenAI

Allan Dafoe

Fonction : Auteur

University of Oxford

Paul Scharre

Fonction : Auteur

Center for a New American Security

Ariel Herbert-Voss

Fonction : Auteur

OpenAI

Martijn Rasser

Fonction : Auteur

Center for a New American Security

Shagun Sodhani

Fonction : Auteur

Université du Québec à Montréal = University of Québec in Montréal

Carrick Flynn

Fonction : Auteur

Center for Security and Emerging Technology

Thomas Krendl Gilbert

Fonction : Auteur

University of California [Berkeley]

Lisa Dyer

Fonction : Auteur

Partnership on AI

Saif Khan

Fonction : Auteur

Center for Security and Emerging Technology

Yoshua Bengio

Fonction : Auteur

Université du Québec à Montréal = University of Québec in Montréal

Markus Anderljung

Fonction : Auteur

Future of Humanity Institute

Domaines

Statistiques [stat]

Fichier principal

2004.07213.pdf (860.58 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Théo Ryffel : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-03065927

Soumis le : mardi 15 décembre 2020-08:40:48

Dernière modification le : vendredi 19 avril 2024-16:18:56

Archivage à long terme le : mardi 16 mars 2021-18:32:20

Dates et versions

hal-03065927 , version 1 (15-12-2020)

Identifiants

HAL Id : hal-03065927 , version 1
ARXIV : 2004.07213

Citer

Miles Brundage, Shahar Avin, Jasmine Wang, Haydn Belfield, Gretchen Krueger, et al.. Toward Trustworthy AI Development: Mechanisms for Supporting Verifiable Claims. 2020. ⟨hal-03065927⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

ENS-PARIS UNIV-RENNES1 CNRS INRIA IRISA INRIA2 INRIA-EPFL PSL UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES UR1-MATH-NUM

81 Consultations

933 Téléchargements

Toward Trustworthy AI Development: Mechanisms for Supporting Verifiable Claims

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Altmetric

Partager