Pular para o conteúdo

Esboço de Tese

Esta tese diz respeito ao comportamento ótimo dos agentes em computação desconhecida ambientes, também conhecidos como inteligência artificial universal. Esses teóricos os agentes são capazes de aprender a executar otimamente em muitos tipos de ambientes.
Embora possam usar de forma otimizada informações prévias sobre o meio ambiente se estiver disponível, em muitos casos eles também aprendem a desempenhar o melhor ausência de tais informações. Além disso, esses agentes podem ser comprovados em cima vinculado ao desempenho de agentes computacionais de propósito geral. Claramente, tais Os agentes são extremamente poderosos e gerais, daí o nome universal artificial inteligência.
Que tais agentes podem ser matematicamente definidos, pode ser uma surpresa para alguns. Certamente, a inteligência artificial foi resolvida? Não é bem.
O problema é que a teoria por trás desses agentes universais assume infinito recursos computacionais. Embora isso simplifique muito a matemática definições e análises, isso também significa que esses modelos não podem ser diretamente
implementados como algoritmos de inteligência artificial. Foram feitos esforços para reduza essas idéias para baixo, no entanto, nenhum desses métodos produziu algoritmos práticos que foram adotados pelo mainstream. O principal O uso da teoria da inteligência artificial universal até agora tem sido como um teor ferramenta com a qual estudar matematicamente as propriedades da maquina super inteligência.
Os fundamentos da inteligência universal datam das origens da filosofia e inferência indutiva. Inteligência artificial universal própria começou com o trabalho acadêmico de Ray J. Solomonoff na década de 1960. Solomonoff estava considerando o problema de prever seqüências binárias. O que ele descobriu foi uma formulação para um sistema de inferência indutiva que pode ser provado muito rapidamente Aprenda a prever de forma ótima qualquer sequência que tenha uma probabilidade computable distribuição. Não só esta teoria é surpreendentemente poderosa, mas também reúne e elegantemente formaliza os principais princípios filosóficos por trás da indução inferência. Além disso, considerando casos especiais do modelo de Solomonoff, pode-se recuperar princípios estatísticos bem conhecidos, como a máxima verossimilhança, comprimento mínimo da descrição e entropia máxima. Isso faz com que o Solomonoff modelo um tipo de grande teoria unificada da inferência indutiva. De fato, se não era por sua incomputabilidade, o problema da indução poderia ser considerado resolvido. Quaisquer preocupações práticas que possa ter sobre o modelo de Solomonoff, a maioria concordaria que é, no entanto, uma bela mistura de matemática e filosofia.
A principal limitação teórica da indução de Solomonoff é que apenas aborda o problema da aprendizagem indutiva passiva, em particular a sequência predição. Se as previsões do agente estão corretas ou não, não tem efeito sobre
a sequência observada no futuro. Assim, o agente é passivo no sentido de que ele é incapaz de influenciar o futuro. Um exemplo disso pode estar prevendo a movimento dos planetas em todo o céu, ou talvez o mercado de ações, assumindo
esse não é rico o suficiente para influenciar o mercado.
No caso ativo mais geral, o agente pode realizar ações que pode afetar o futuro observado. Por exemplo, um agente que joga xadrez não só observa o outro jogador, também é capaz de fazer movimentos em si para aumenta as chances de ganhar o jogo. Esta é uma configuração muito geral em que aparentemente qualquer tipo de objetivo dirigido problema pode ser enquadrado. Não é necessário assumir, como normalmente é feito na teoria dos jogos, que o ambiente, neste caso outro jogador, joga otimamente. Nós também não assumimos que o O comportamento do ambiente é Markoviano, como normalmente é feito no controle Teoria e reforço da aprendizagem.
No final da década de 1990, Marcus Hutter ampliou a indução passiva de Solomonoff modelo para o caso ativo, combinando-o com a teoria de decisão seqüencial. este produziu uma teoria de agentes universais, e em particular um agente universal para uma classe muito geral de ambientes interativos, conhecido como agente AIXI.
Hutter pôde provar que o comportamento de agentes universais converge para ideal em qualquer configuração onde este seja possível para um agente geral, e que esses agentes são Pareto otimizados no sentido de que nenhum agente pode realizar bem como em todos os ambientes e estritamente melhor em pelo menos um. Estes são os resultados mais conhecidos para um agente de uso geral. Dado que AIXI possui características gerais e de desempenho extremo, pode ser
considerado um modelo teórico de um agente super inteligente.
Infelizmente, resultados ainda mais fortes que mostram que o AIXI converge para o melhor comportamento rápido, semelhante ao resultado de convergência da Solomonoff, foi mostrado para ser impossível em algumas configurações, e continuar a ser uma questão aberta em outros. De fato, muitas questões sobre inteligência artificial universal permanecem abertas. Em parte Isso porque a área é bastante nova, com poucas pessoas trabalhando nela e, em parte, porque provar resultados sobre agentes inteligentes universais parece ser difícil.
O objetivo desta tese é explorar algumas das questões abertas que cercam inteligência artificial universal. Em particular: Em quais configurações o comportamento de agentes universais converge para o ideal, a maneira como a teoria de AIXI se relaciona para o conceito e definição de inteligência, as limitações que computavam os agentes enfrentam quando tentam se aproximar de agentes super inteligentes teóricos como AIXI e, finalmente, algumas das grandes implicações de super inteligentes máquinas e se este é um tópico que merece maior estudo.
Grande parte do trabalho apresentado nesta tese vem de publicações anteriores. Dentro alguns casos, capítulos inteiros são fortemente baseados em publicações anteriores, em outros Os casos de trabalho anterior são mencionados apenas de passagem. Além disso, enquanto eu escrevi O texto da tese, naturalmente, nem todas as idéias e o trabalho apresentado são meu próprio. Além do material de fundo apresentado, muitos dos resultados e As idéias nesta tese foram desenvolvidas através da colaboração com vários colegas, em particular meu supervisor Marcus Hutter. Esta seção descreve o conteúdo da tese e também fornece algumas orientações sobre a natureza de minha contribuição para cada capítulo.
1) Natureza e Medição da Inteligência. O capítulo 1 começa a tese com a questão mais fundamental de todos: o que é inteligência? Surpreendentemente, Livros e documentos e teses sobre inteligência artificial raramente exploram a inteligência
na verdade é, ou o que a inteligência artificial está tentando alcançar. Quando eles lembre-se do tópico que geralmente mencionam o teste de Turing e que o conceito de inteligência é mal definido, antes de avançar para algoritmos que
presumivelmente tem essa qualidade misteriosa. Como esta tese diz respeito a modelos de sistemas que afirmamos serem extremamente inteligentes, devemos primeiro explorar os diferentes testes e definições de inteligência que foram propostas para humanos, animais e máquinas. Nós extraímos desta definição informal de inteligência que usaremos ao longo do resto da tese.
Esta visão geral da teoria, definição e teste de inteligência é minha própria trabalhos. Este capítulo é baseado em (Legg e Hutter, 2007c), em particular o partes que foram construídas sobre (Legg e Hutter 2007b; 2007a).
2) Inteligência Artificial Universal. Atualmente, o AIXI não é amplamente conhecido em círculos acadêmicos, embora tenha capturado a imaginação de uma comunidade interessada em novas abordagens de inteligência artificial de propósito geral, assim chamado Inteligência geral artificial (AGI). No entanto, mesmo dentro desta comunidade, ele é claro que existe alguma confusão sobre o AIXI e a inteligência artificial universal.
Isso pode ser atribuído em parte ao fato de que as exposições atuais de AIXI é difícil para os não matemáticos digerir. Como tal, um pouco técnico A introdução do assunto seria útil. Isso não só deve ajudar a esclarecer alguns equívocos, também pode servir como um aperitivo para os mais técnicos tratamentos que foram publicados por Hutter. O Capítulo 2 fornece tal uma introdução. Começa com os fundamentos da inferência indutiva e lentamente constrói o agente AIXI e suas principais propriedades teóricas.
Esta introdução à inteligência artificial universal não foi publicada antes, embora pequenas partes dela fossem derivadas (Hutter et al., 2007) e (Legg, 1997). A seção 2.6 é amplamente baseada no material em (Hutter, 2007a), e as seções que seguem isso (Hutter, 2005)