Artificial Intelligence for Dummies 2018 Pt
Artificial Intelligence for Dummies 2018 Pt
Artificial Intelligence for Dummies 2018 Pt
com
Artificial
Inteligência
Artificial
Inteligência
por John Paul Mueller
e Luca Massaron
Inteligência Artificial Para Dummies®
Publicado por:John Wiley & Sons, Inc.,111 River Street, Hoboken, NJ 07030-5774,www.wiley.com
Copyright © 2018 por John Wiley & Sons, Inc., Hoboken, Nova Jersey
Nenhuma parte desta publicação pode ser reproduzida, armazenada em um sistema de recuperação ou transmitida de qualquer
forma ou por qualquer meio, eletrônico, mecânico, fotocópia, gravação, digitalização ou outro, exceto conforme permitido nas Seções
107 ou 108 do 1976 United States Copyright Agir, sem a prévia autorização por escrito da Editora. Solicitações de permissão à Editora
devem ser endereçadas ao Departamento de Permissões, John Wiley & Sons, Inc., 111 River Street, Hoboken, NJ 07030, (201) 748-6011,
fax (201) 748-6008 ou on-line emhttp://www.wiley.com/go/permissions.
Marcas registradas:Wiley, For Dummies, o logotipo do Dummies Man, Dummies.com, Making Everything Easier e marcas comerciais
relacionadas são marcas comerciais ou marcas registradas da John Wiley & Sons, Inc. e não podem ser usadas sem permissão por escrito. Todas
as outras marcas comerciais são de propriedade de seus respectivos proprietários. A John Wiley & Sons, Inc. não está associada a nenhum
produto ou fornecedor mencionado neste livro.
Para obter informações gerais sobre nossos outros produtos e serviços, entre em contato com nosso Departamento de Atendimento ao Cliente
nos EUA pelo telefone 877-762-2974, fora dos EUA pelo telefone 317-572-3993 ou fax 317-572-4002. Para suporte técnico, visite
https://hub.wiley.com/community/support/dummies.
Wiley publica em uma variedade de formatos impressos e eletrônicos e por impressão sob demanda. Alguns materiais incluídos nas
versões impressas padrão deste livro podem não estar incluídos nos e-books ou na impressão sob demanda. Se este livro se referir
a uma mídia como um CD ou DVD que não está incluída na versão que você comprou, você pode baixar este material em
http://booksupport.wiley.com.Para mais informações sobre os produtos Wiley, visitewww.wiley.com.
10 9 8 7 6 5 4 3 2 1
Resumo do conteúdo
Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Parte 1: Apresentando a IA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
CAPÍTULO 1: Apresentando a IA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
CAPÍTULO 2: Definindo a função dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
CAPÍTULO 3: Considerando o Uso de Algoritmos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Índice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295
Índice
INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Sobre este livro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Ícones usados neste livro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Além do Livro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Para
onde ir a partir daqui . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
PARTE 1: APRESENTANDO A IA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
CAPÍTULO 1: Apresentando IA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Definindo o termo AI. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Inteligência criteriosa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Descobrindo quatro maneiras de definir IA . . . . . . . . . . . . . . . . . . . . . . . . . .
.12 Compreendendo a história da IA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14
Começando com a lógica simbólica em Dartmouth. . . . . . . . . . . . . . . . . . . .15
Continuando com sistemas especialistas . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.16 Superando os invernos de IA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16
Considerando usos de IA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17
Evitando o hype da IA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18
Conectando AI ao computador subjacente . . . . . . . . . . . . . . . . . . . . . .19
Índice vii
CAPÍTULO 3: Considerando o uso de algoritmos . . . . . . . . . . . . . . . . . . . 39
Compreendendo o Papel dos Algoritmos. . . . . . . . . . . . . . . . . . . . . . . . . . .40
Entendendo o quealgoritmosignifica . . . . . . . . . . . . . . . . . . . . . . . .40
Começando pelo planejamento e ramificação . . . . . . . . . . . . . . . . . . . . . . . .41
Jogar jogos adversários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .44 Usando
pesquisa local e heurística . . . . . . . . . . . . . . . . . . . . . . . . . . . .46 Descobrindo a
Learning Machine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .49
Alavancando sistemas especialistas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .50
Introdução ao aprendizado de máquina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .52
Alcançando novas alturas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .53
Índice ix
Troca de Idéias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .114
Criando conexões. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .114
Aumentando a comunicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .115
Definição de tendências
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
Índice XI
Entrando em um carro autônomo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .214
Juntando toda a tecnologia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .215
Deixar a IA entrar em cena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .216
Entender isso não é apenas IA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .217
Superando a Incerteza das Percepções . . . . . . . . . . . . . . . . . . . . . . . .218
Apresentando os sentidos do carro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.219 Juntando o que você percebe . . . . . . . . . . . . . . . . . . . . . . . . .221
Vendo AI no espaço
CAPÍTULO 16: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
Índice xiii
Trabalhando com IA no Espaço. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .284
Entrega de mercadorias para estações espaciais. . . . . . . . . . . . . . . . . . . . . . . . .
.284 Mineração de recursos extraplanetários . . . . . . . . . . . . . . . . . . . . . . . . . . .285
Explorando outros planetas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .286
ÍNDICE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295
Usando várias mídias como ponto de partida, você pode perceber que a maioria das
tecnologias úteis são quase chatas. Certamente, ninguém jorra sobre eles. A IA é assim: tão
onipresente que chega a ser monótona. Você está até usando IA de alguma forma hoje; na
verdade, você provavelmente depende da IA de muitas maneiras diferentes - você
simplesmente não percebe porque é muito mundano.Inteligência Artificial Para Dummiestorna
você ciente desses usos muito reais e essenciais da IA. Um termostato inteligente para sua casa
pode não parecer muito empolgante, mas é um uso incrivelmente prático para uma tecnologia
que faz algumas pessoas correrem aterrorizadas.
Claro,Inteligência Artificial Para Dummiestambém cobre os usos realmente legais da IA. Por
exemplo, você pode não saber que existe um dispositivo de monitoramento médico que pode
realmente prever quando você pode ter um problema cardíaco, mas esse dispositivo existe. A
IA alimenta drones, dirige carros e possibilita todos os tipos de robôs. Você vê a IA usada hoje
em todos os tipos de aplicações espaciais, e a IA figura com destaque em todas as aventuras
espaciais que os humanos terão amanhã.
Introdução 1
deste livro é que os humanos sempre serão importantes. Na verdade, a IA torna os humanos
ainda mais importantes porque ajuda os humanos a se destacarem de maneiras que você
francamente pode não ser capaz de imaginar.
Para uma tecnologia sobreviver, ela deve ter um conjunto de aplicações sólidas que realmente
funcionem. Também deve fornecer um retorno aos investidores com a previsão de investir na
tecnologia. No passado, a IA falhou em alcançar o sucesso crítico porque faltava alguns desses
recursos. A IA também sofria por estar à frente de seu tempo: a verdadeira IA precisava esperar
que o hardware atual fosse realmente bem-sucedido. Hoje, você pode encontrar a IA usada em
vários aplicativos de computador e para automatizar processos. Também é muito utilizado no
campo médico e para ajudar a melhorar a interação humana. A IA também está relacionada à
análise de dados, aprendizado de máquina e aprendizado profundo. Às vezes, esses termos
podem ser confusos, então uma das razões para lerInteligência Artificial Para Dummiesé
descobrir como essas tecnologias se interconectam.
A IA tem um futuro verdadeiramente brilhante hoje porque se tornou uma tecnologia essencial.
Este livro também mostra os caminhos que a IA provavelmente seguirá no futuro. As várias
tendências discutidas neste livro são baseadas no que as pessoas estão realmente tentando
fazer agora. A nova tecnologia ainda não teve sucesso, mas como as pessoas estão trabalhando
nela, ela tem uma boa chance de sucesso em algum momento.
Para tornar a absorção dos conceitos ainda mais fácil, este livro usa as seguintes
convenções:
»Os endereços da Web aparecem emmonofont.Se você estiver lendo uma versão digital deste
reserve em um dispositivo conectado à Internet, observe que você pode clicar no
endereço da Web para visitar esse site, assim:www.dummies.com.
»palavras emitálicosão definidos em linha como termos especiais que você deve lembrar.
Você vê essas palavras usadas (e às vezes mal usadas) de muitas maneiras diferentes
na imprensa e em outras mídias, como filmes. Saber o significado desses termos
pode ajudá-lo a eliminar parte do hype em torno da IA.
As dicas são legais porque ajudam você a economizar tempo ou realizar alguma tarefa sem
muito trabalho extra. As dicas deste livro são técnicas de economia de tempo ou indicações de
recursos que você deve experimentar para obter o máximo benefício do aprendizado sobre IA.
Não queremos parecer pais zangados ou algum tipo de maníaco, mas você deve evitar
fazer qualquer coisa marcada com um ícone de Aviso. Caso contrário, você pode
descobrir que se envolve no tipo de desinformação que deixa as pessoas com medo da IA
hoje.
Sempre que vir este ícone, pense em uma dica ou técnica avançada. Você pode achar esses
fragmentos de informações úteis muito chatos para palavras, ou eles podem conter a solução
que você precisa para criar ou usar uma solução de IA. Pule essas informações sempre que
quiser.
Se você não conseguir mais nada de um determinado capítulo ou seção, lembre-se do material
marcado por este ícone. Este texto geralmente contém um processo essencial ou um pouco de
informação que você deve saber para interagir com a IA com sucesso.
além do livro
Este livro não é o fim de sua experiência de descoberta de IA; é realmente apenas o começo.
Fornecemos conteúdo on-line para tornar este livro mais flexível e capaz de atender melhor às suas
necessidades. Dessa forma, à medida que John recebe seu e-mail, podemos responder a perguntas e
informar como as atualizações da IA ou de suas tecnologias associadas afetam o conteúdo do livro.
Na verdade, você ganha acesso a todas essas adições interessantes:
»Folha de dicas:Você se lembra de usar notas de berço na escola para fazer uma nota melhor
em um teste, não é? Você faz? Bem, uma folha de dicas é mais ou menos assim. Ele
fornece algumas notas especiais sobre tarefas que você pode realizar com IA que nem
todo mundo conhece. Você pode encontrar a folha de dicas deste livro acessando
www.dummies.come procurando porFolha de dicas de inteligência artificial para leigos.
A folha de dicas contém informações realmente interessantes, como o significado de
todas aquelas estranhas siglas e abreviações associadas à IA, aprendizado de máquina e
aprendizado profundo.
Introdução 3
»Atualizações:Às vezes, mudanças acontecem. Por exemplo, podemos não ter visto
uma mudança futura quando olhamos para nossas bolas de cristal durante a escrita
deste livro. No passado, isso significava simplesmente que o livro ficaria desatualizado e
menos útil, mas agora você pode encontrar atualizações do livro acessando
www.dummies.come pesquisando o título deste livro.
Se o seu principal objetivo ao ler este livro for adquirir conhecimento sobre onde a IA é usada
hoje, comece com o Capítulo 5. Os materiais da Parte 2 ajudam você a ver onde a IA é usada
hoje.
Os leitores que possuem um conhecimento um pouco mais avançado sobre IA podem começar
com o Capítulo 9. A Parte 3 deste livro contém o material mais avançado que você encontrará.
Se você não quiser saber como a IA funciona em um nível inferior (não como desenvolvedor,
mas simplesmente como alguém interessado em IA), pode pular esta parte do livro.
Ok, então você quer saber as maneiras super fantásticas pelas quais as pessoas estão usando
IA hoje ou usarão IA no futuro. Se for esse o caso, comece com o Capítulo 12. Todas as partes 4
e 5 mostram as maneiras incríveis pelas quais a IA é usada sem forçá-lo a lidar com pilhas de
exageros como resultado. As informações da Parte 4 se concentram no hardware que depende
da IA, e o material da Parte 5 se concentra mais nos usos futuristas da IA.
da IA.
NESTE CAPÍTULO
Capítulo1
Apresentando IA
A
A inteligência artificial (IA) teve vários começos e paradas falsos ao longo dos
anos, em parte porque as pessoas realmente não entendem o que é a IA, ou
mesmo o que ela deve realizar. Uma parte importante do problema é que filmes,
programas de televisão e livros conspiraram para dar falsas esperanças sobre o que a IA
realizará. Além disso, a tendência humana deantropomorfizar (dar características
humanas a) a tecnologia faz parecer que a IA deve fazer mais do que pode esperar
realizar. Portanto, a melhor maneira de começar este livro é definir o que a IA realmente
é, o que não é e como ela se conecta aos computadores hoje.
Claro, a base para o que você espera da IA é uma combinação de como você define a IA, a
tecnologia que você tem para implementá-la e os objetivos que você tem para a IA.
Consequentemente, todo mundo vê a IA de maneira diferente. Este livro adota uma
abordagem intermediária, visualizando a IA de tantas perspectivas diferentes quanto possível.
Ele não aceita o exagero oferecido pelos proponentes, nem se entrega à negatividade
defendida pelos detratores, para que você obtenha a melhor visão possível da IA como uma
tecnologia. Como resultado, você pode achar que tem expectativas um pouco diferentes das
que encontra neste livro, o que é bom, mas é essencial considerar o que a tecnologia pode
realmente fazer por você, em vez de esperar algo que ela não pode.
Definindo o termo IA
Antes de poder usar um termo de maneira significativa e útil, você deve ter uma definição para
ele. Afinal, se ninguém concorda com um significado, o termo não tem nenhum; é apenas
CAPÍTULO 1Apresentando IA 7
uma coleção de personagens. Definir o idioma (um termo cujo significado não é claro a partir
dos significados de seus elementos constituintes) é especialmente importante com termos
técnicos que receberam mais do que uma pequena cobertura da imprensa em vários
momentos e de várias maneiras.
Dizer que a IA é uma inteligência artificial realmente não diz nada significativo, e é por
isso que há tantas discussões e divergências sobre esse termo. Sim, você pode
argumentar que o que ocorre é artificial, não tendo vindo de uma fonte natural. No
entanto, a parte da inteligência é, na melhor das hipóteses, ambígua. Mesmo que você
não concorde necessariamente com a definição de IA conforme aparece nas seções a
seguir, este livro usa a IA de acordo com essa definição, e conhecê-la o ajudará a
acompanhar o restante do texto com mais facilidade.
Inteligência perspicaz
As pessoas definem inteligência de muitas maneiras diferentes. No entanto, você pode dizer que a
inteligência envolve certas atividades mentais compostas pelas seguintes atividades:
A lista poderia facilmente ficar muito longa, mas mesmo esta lista é relativamente sujeita à
interpretação por qualquer um que a aceite como viável. Como você pode ver na lista, no entanto, a
inteligência geralmente segue um processo que um sistema de computador pode imitar como parte
de uma simulação:
8 PARTE 1Apresentando IA
4.Manipule os dados de forma que eles alcancem uma forma consistente com as informações
existentes.
8.Repita as Etapas 2 a 7 conforme necessário até que a meta seja alcançada (constatada verdadeira)
ou as possibilidades de alcançá-la se esgotem (constatada falsa).
Mesmo que você possa criar algoritmos e fornecer acesso a dados para dar suporte a esse processo
em um computador, a capacidade de um computador de obter inteligência é severamente limitada.
Por exemplo, um computador é incapaz de entender qualquer coisa porque depende de processos de
máquina para manipular dados usando matemática pura de maneira estritamente mecânica. Da
mesma forma, os computadores não conseguem separar facilmente a verdade da inverdade
(conforme descrito no Capítulo 2). Na verdade, nenhum computador pode implementar totalmente
nenhuma das atividades mentais descritas na lista que descreve a inteligência.
Como parte da decisão sobre o que a inteligência realmente envolve, categorizar a inteligência
também é útil. Os seres humanos não usam apenas um tipo de inteligência, mas dependem de
múltiplas inteligências para realizar tarefas. Howard Gardner, de Harvard, definiu vários desses
tipos de inteligência (verhttp://www.pz.harvard.edu/projects/ inteligências múltiplaspara
obter detalhes), e conhecê-los ajuda a relacioná-los com os tipos de tarefas que um
computador pode simular como inteligência (consulte a Tabela1-1 para uma versão modificada
dessas inteligências com descrição adicional).
(contínuo)
CAPÍTULO 1Apresentando IA 9
TABELA 1-1(contínuo)
Interpessoal Baixo a moderado telefone, áudio A interação com os outros ocorre em vários
conferência, vídeo níveis. O objetivo dessa forma de
conferência, escrita, inteligência é obter, trocar, dar e manipular
computador informações com base nas experiências dos
conferência, e-mail outros. Os computadores podem responder
perguntas básicas
perguntas por causa da entrada de palavras-
chave, não porque eles entendem a pergunta. A
inteligência ocorre durante a obtenção de
informações, localização de palavras-chave
adequadas e, em seguida, fornecimento de
informações com base nessas
palavras-chave. Termos de referência cruzada
em uma tabela de pesquisa e, em seguida, agir
de acordo com as instruções fornecidas pela
tabela demonstram inteligência lógica, não
inteligência interpessoal.
10 PARTE 1Apresentando IA
Tipo Potencial de Simulação Ferramentas Humanas Descrição
intrapessoal Nenhum livros, criativo Olhar para dentro para entender os próprios
materiais, diários, interesses e, em seguida, estabelecer metas
privacidade e tempo com base nesses interesses é atualmente um
tipo de inteligência exclusivamente humana.
Como máquinas, os computadores não têm
desejos, interesses, vontades ou habilidades
criativas. Uma IA processa entrada numérica
usando um conjunto de algoritmos e fornece
uma saída, não está ciente de nada do que faz,
nem entende nada do que faz.
CAPÍTULO 1Apresentando IA 11
Descobrindo quatro maneiras de definir IA
Conforme descrito na seção anterior, o primeiro conceito que é importante entender é
que a IA realmente não tem nada a ver com a inteligência humana. Sim, algumas IAs são
modeladas para simular a inteligência humana, mas é isso mesmo: uma simulação. Ao
pensar em IA, observe uma interação entre a busca de objetivos, o processamento de
dados usado para atingir esse objetivo e a aquisição de dados usada para entender
melhor o objetivo. A IA depende de algoritmos para alcançar um resultado que pode ou
não ter nada a ver com objetivos humanos ou métodos para alcançá-los. Com isso em
mente, você pode categorizar a IA de quatro maneiras:
»Agir humanamente:Quando um computador age como um ser humano, ele reflete melhor o Turing
teste, no qual o computador é bem-sucedido quando a diferenciação entre o computador e
um humano não é possível (consultehttp://www.turing.org.uk/scrapbook/test. htmlpara
detalhes). Esta categoria também reflete o que a mídia quer que você acredite que a IA é. Você
o vê empregado para tecnologias como processamento de linguagem natural, representação
de conhecimento, raciocínio automatizado e aprendizado de máquina (todos os quatro devem
estar presentes para passar no teste).
O Teste de Turing original não incluía nenhum contato físico. O mais recente Teste de
Turing Total inclui contato físico na forma de interrogatório de habilidade perceptiva, o que
significa que o computador também deve empregar visão computacional e robótica para
ter sucesso. As técnicas modernas incluem a ideia de atingir o objetivo em vez de imitar
completamente os humanos. Por exemplo, os irmãos Wright não conseguiram criar um
avião copiando precisamente o vôo dos pássaros; em vez disso, os pássaros forneceram
ideias que levaram à aerodinâmica que, por fim, levou ao vôo humano. O objetivo é voar.
Tanto os pássaros quanto os humanos atingem esse objetivo, mas usam abordagens
diferentes.
»Pensando humanamente:Quando um computador pensa como um ser humano, ele executa tarefas
que exigem inteligência (em contraste com procedimentos mecânicos) de um ser humano para
ter sucesso, como dirigir um carro. Para determinar se um programa pensa como um humano,
você deve ter algum método para determinar como os humanos pensam, o que é definido pela
abordagem de modelagem cognitiva. Este modelo se baseia em três técnicas:
12 PARTE 1Apresentando IA
Depois de criar um modelo, você pode escrever um programa que simule o modelo. Dada a
quantidade de variabilidade entre os processos de pensamento humano e a dificuldade de
representar com precisão esses processos de pensamento como parte de um programa, os
resultados são, na melhor das hipóteses, experimentais. Esta categoria de pensamento
humano é freqüentemente usada em psicologia e outros campos nos quais a modelagem do
processo de pensamento humano para criar simulações realistas é essencial.
»Agir racionalmente:Estudar como os seres humanos agem em determinadas situações sob condições específicas
As restrições permitem determinar quais técnicas são eficientes e eficazes. Um
computador que age racionalmente depende das ações registradas para interagir com um
ambiente com base nas condições, fatores ambientais e dados existentes. Assim como o
pensamento racional, os atos racionais dependem de uma solução em princípio, que pode
não ser útil na prática. No entanto, os atos racionais fornecem uma linha de base sobre a
qual um computador pode começar a negociar a conclusão bem-sucedida de uma meta.
CAPÍTULO 1Apresentando IA 13
As categorias usadas para definir a IA oferecem uma maneira de considerar vários usos ou maneiras
de aplicar a IA. Alguns dos sistemas usados para classificar IA por tipo são arbitrários e não distintos.
Por exemplo, alguns grupos veem a IA como forte (inteligência generalizada que pode se adaptar a
uma variedade de situações) ou fraca (inteligência específica projetada para executar bem uma
determinada tarefa). O problema com a IA forte é que ela não executa bem nenhuma tarefa,
enquanto a IA fraca é muito específica para realizar tarefas de forma independente. Mesmo assim,
apenas duas classificações de tipo não farão o trabalho, mesmo em um sentido geral. Os quatro tipos
de classificação promovidos por Arend Hintze (verhttp://theconversation.
com/entendendo-os-quatro-tipos-de-IA-de-robôs-reativos-para-
seres autoconscientes-67616para obter detalhes) formam uma base melhor para entender a IA:
»Memória limitada:Um carro autônomo ou um robô autônomo não pode perder tempo
para tomar todas as decisões do zero. Essas máquinas contam com uma pequena
quantidade de memória para fornecer conhecimento experimental de várias situações.
Quando a máquina se depara com a mesma situação, pode contar com a experiência para
reduzir o tempo de reação e fornecer mais recursos para a tomada de novas decisões que
ainda não foram tomadas. Este é um exemplo do nível atual de IA forte.
Entendendo a história da IA
As seções anteriores deste capítulo ajudam você a entender a inteligência da perspectiva
humana e a ver como os computadores modernos são lamentavelmente inadequados
para simular tal inteligência, muito menos para se tornarem eles próprios inteligentes.
14 PARTE 1Apresentando IA
No entanto, o desejo de criar máquinas inteligentes (ou, na antiguidade, ídolos) é tão
antigo quanto os humanos. O desejo de não estar sozinho no universo, de ter algo com o
que se comunicar sem as inconsistências de outros humanos, é forte. Claro, um único
livro não pode contemplar toda a história humana, então as seções a seguir fornecem
uma visão geral breve e pertinente da história das tentativas modernas de IA.
CAPÍTULO 1Apresentando IA 15
Continuando com sistemas especialistas
Os sistemas especialistas apareceram pela primeira vez na década de 1970 e novamente na década de 1980
como uma tentativa de reduzir os requisitos computacionais impostos pela IA usando o conhecimento de
especialistas. Surgiram várias representações de sistemas especialistas, incluindo as baseadas em regras (que
usam instruções if...then para basear decisões em regras de ouro), baseadas em quadros (que usam bancos
de dados organizados em hierarquias relacionadas de informações genéricas chamadas quadros) e baseadas
em lógica ( que dependem da teoria dos conjuntos para estabelecer relações). O advento dos sistemas
especialistas é importante porque eles apresentam as primeiras implementações verdadeiramente úteis e
bem-sucedidas da IA.
Você ainda vê sistemas especialistas em uso hoje (mesmo que eles não sejam mais chamados assim).
Por exemplo, os verificadores ortográficos e gramaticais em seu aplicativo são tipos de sistemas
especialistas. O verificador gramatical, especialmente, é fortemente baseado em regras. Vale a pena
olhar ao redor para ver outros lugares onde os sistemas especialistas ainda podem ter uso prático em
aplicações cotidianas.
Um problema com os sistemas especialistas é que eles podem ser difíceis de criar e manter. Os
primeiros usuários tiveram que aprender linguagens de programação especializadas, como List
Processing (LisP) ou Prolog. Alguns fornecedores viram uma oportunidade de colocar sistemas
especialistas nas mãos de programadores menos experientes ou novatos usando produtos como VP-
Especialista (verhttp://www.csis.ysu.edu/~john/824/vpxguide.htmlehttps://
www.amazon.com/exec/obidos/ASIN/155622057X/datacservip0f-20/),
que dependem da abordagem baseada em regras. No entanto, esses produtos geralmente forneciam
funcionalidade extremamente limitada no uso de bases de conhecimento pequenas.
Superando os invernos de IA
O termoinverno AIrefere-se a um período de financiamento reduzido no desenvolvimento da
IA. Em geral, a IA seguiu um caminho em que os proponentes superestimam o que é possível,
induzindo pessoas sem nenhum conhecimento de tecnologia, mas com muito dinheiro, a fazer
investimentos. Segue-se um período de críticas quando a IA falha em atender às expectativas e,
finalmente, ocorre a redução do financiamento. Vários desses ciclos ocorreram ao longo dos
anos – todos eles devastadores para o verdadeiro progresso.
16 PARTE 1Apresentando IA
A IA está atualmente em uma nova fase de hype por causa deaprendizado de máquina,uma
tecnologia que ajuda os computadores a aprender com os dados. Ter um computador aprendendo
com dados significa não depender de um programador humano para definir operações (tarefas), mas
derivá-las diretamente de exemplos que mostram como o computador deve se comportar. É como
educar um bebê mostrando-lhe como se comportar através do exemplo. O aprendizado de máquina
tem armadilhas porque o computador pode aprender a fazer as coisas incorretamente por meio de
um ensino descuidado.
As pessoas estão dizendo que o inverno da IA acabou por causa do aprendizado profundo, e isso é
verdade por enquanto. No entanto, quando você olha em volta para as maneiras pelas quais as
pessoas estão vendo a IA, você pode facilmente descobrir que outra fase de crítica eventualmente
ocorrerá, a menos que os proponentes diminuam a retórica. A IA pode fazer coisas incríveis, mas elas
são incríveis de uma forma mundana, conforme descrito na próxima seção.
Considerando usos de IA
Você encontra a IA usada em muitos aplicativos hoje. O único problema é que a tecnologia
funciona tão bem que você nem sabe que ela existe. Na verdade, você pode se surpreender ao
descobrir que muitos dispositivos em sua casa já usam IA. Por exemplo, alguns termostatos
inteligentes criam programações automaticamente para você com base em como você controla
manualmente a temperatura. Da mesma forma, a entrada de voz usada para controlar alguns
dispositivos aprende como você fala para poder interagir melhor com você. A IA
definitivamente aparece em seu carro e principalmente no local de trabalho. Na verdade, os
usos da IA chegam aos milhões - todos seguros fora de vista, mesmo quando são bastante
dramáticos por natureza. Aqui estão apenas algumas das maneiras pelas quais você pode ver a
IA usada:
CAPÍTULO 1Apresentando IA 17
»Agendamento de recursos:Muitas organizações precisam agendar o uso de
recursos de forma eficiente. Por exemplo, um hospital pode ter que determinar onde colocar um
paciente com base nas necessidades do paciente, na disponibilidade de especialistas qualificados
e na quantidade de tempo que o médico espera que o paciente fique no hospital.
»Análise complexa:Os seres humanos geralmente precisam de ajuda com análises complexas porque
existem literalmente muitos fatores a serem considerados. Por exemplo, o mesmo conjunto de
sintomas pode indicar mais de um problema. Um médico ou outro especialista pode precisar de
ajuda para fazer um diagnóstico em tempo hábil para salvar a vida de um paciente.
»Atendimento ao Cliente:A linha de atendimento ao cliente para a qual você liga hoje pode nem
tem um humano por trás disso. A automação é boa o suficiente para seguir scripts e usar
vários recursos para lidar com a grande maioria de suas perguntas. Com uma boa inflexão
de voz (fornecida também pela IA), você pode nem conseguir dizer que está falando com
um computador.
muitos sistemas de frenagem automática dependem da IA para parar o carro com base em todas as
Evitando o hype da IA
Este capítulo menciona bastante o hype da IA. Infelizmente, o capítulo nem arranha a
superfície de todo o hype que está por aí. Se você assistir a filmes comoDela
(https://www.amazon.com/exec/obidos/ASIN/B00H9HZGQ0/datacservip0f-20/) eEx
Machina(https://www.amazon.com/exec/obidos/ASIN/B00XI057M0/datac
servip0f-20/),você pode ser levado a acreditar que a IA está mais avançada do que está. O
problema é que a IA está realmente em sua infância e qualquer tipo de aplicação, como as
mostradas nos filmes, é a saída criativa de uma imaginação hiperativa.
18 PARTE 1Apresentando IA
Você já deve ter ouvido falar de algo chamado singularidade, que é responsável pelas
reivindicações potenciais apresentadas na mídia e nos filmes. Osingularidadeé essencialmente
um algoritmo mestre que engloba todas as cinco tribos de aprendizado usadas no aprendizado
de máquina. Para alcançar o que essas fontes estão dizendo, a máquina deve ser capaz de
aprender como um ser humano aprenderia — conforme especificado pelos sete tipos de
inteligência discutidos na seção “Inteligência perspicaz”, no início do capítulo. Aqui estão as
cinco tribos do aprendizado:
»Simbolistas:A origem desta tribo está na lógica e na filosofia. Este grupo depende
na dedução inversa para resolver problemas.
»Bayesianos:A origem desta tribo está nas estatísticas e se baseia em inferências probabilísticas
ência para resolver problemas.
Para tornar as coisas ainda menos claras, as cinco tribos podem não ser capazes de fornecer
informações suficientes para realmente resolver o problema da inteligência humana, então criar
algoritmos mestres para todas as cinco tribos ainda pode não produzir a singularidade. Neste ponto,
você deve se surpreender com o quanto as pessoas não sabem sobre como pensam ou por que
pensam de uma determinada maneira. Quaisquer rumores que você ouça sobre a IA dominando o
mundo ou se tornando superior às pessoas são simplesmente falsos.
CAPÍTULO 1Apresentando IA 19
O tamanho do sistema de computação é diretamente proporcional à quantidade de trabalho
que você espera que a IA execute.
O aplicativo também pode variar em tamanho, complexidade e até localização. Por exemplo, se
você é uma empresa e deseja analisar os dados do cliente para determinar a melhor forma de
fazer um discurso de vendas, pode contar com um aplicativo baseado em servidor para
executar a tarefa. Por outro lado, se você é um cliente e deseja encontrar produtos na Amazon
para acompanhar seus itens de compra atuais, o aplicativo nem reside no seu computador;
você o acessa por meio de um aplicativo baseado na web localizado nos servidores da Amazon.
20 PARTE 1Apresentando IA
NESTE CAPÍTULO
Capítulo2
Definindo a função dos dados
T
aqui não há nada de novo sobre os dados. Todo aplicativo interessante já escrito para
um computador tem dados associados a ele. Os dados vêm em muitas formas - alguns
organizados, outros não. O que mudou foi a quantidade de dados. Algumas pessoas
acham quase aterrorizante que agora tenhamos acesso a tantos dados que detalham quase
todos os aspectos da vida da maioria das pessoas, às vezes em um nível que nem mesmo a
pessoa percebe. Além disso, o uso de hardware avançado e melhorias nos algoritmos tornam
os dados o recurso universal para IA atualmente.
Para trabalhar com dados, você deve primeiro obtê-los. Hoje, os aplicativos coletam dados
manualmente, como antigamente, e também automaticamente, usando novos métodos. No entanto,
não se trata apenas de uma ou duas técnicas de coleta de dados; os métodos de coleta ocorrem em
um continuum de totalmente manual a totalmente automático.
Os dados brutos geralmente não funcionam bem para fins de análise. Este capítulo também ajuda
você a entender a necessidade de manipular e moldar os dados para que atendam a requisitos
específicos. Você também descobre a necessidade de definir o valor verdadeiro dos dados para
garantir que os resultados da análise correspondam às metas definidas para os aplicativos em
primeiro lugar.
Curiosamente, você também tem que lidar com limites de aquisição de dados. Atualmente, não
existe nenhuma tecnologia para capturar pensamentos da mente de alguém por meios
telepáticos. Claro, também existem outros limites - a maioria dos quais você provavelmente já
conhece, mas pode não ter considerado.
Mais do que um chavão usado pelos fornecedores para propor novas formas de armazenar dados e
analisá-los, a revolução do big data é uma realidade cotidiana e uma força motriz de nossos tempos.
Você já deve ter ouvido falar de big data em muitas publicações científicas e de negócios
especializadas e até mesmo se perguntado o que o termo realmente significa. Do ponto de vista
técnico,grandes dadosrefere-se a quantidades grandes e complexas de dados de computador, tão
grandes e intrincados que os aplicativos não conseguem lidar com os dados usando armazenamento
adicional ou aumentando a potência do computador.
Big data implica uma revolução no armazenamento e manipulação de dados. Isso afeta o que
você pode conseguir com os dados em termos mais qualitativos (além de fazer mais, você pode
executar melhor as tarefas). Os computadores armazenam big data em diferentes formatos de
uma perspectiva humana, mas o computador vê os dados como um fluxo de uns e zeros (a
linguagem central dos computadores). Você pode visualizar os dados como sendo um dos dois
tipos, dependendo de como você os produz e os consome. Alguns dados têm uma estrutura
clara (você sabe exatamente o que eles contêm e onde encontrar todos os dados), enquanto
outros dados não são estruturados (você tem uma ideia do que eles contêm, mas não sabe
exatamente como está organizado) .
Exemplos típicos de dados estruturados são tabelas de banco de dados, nas quais as informações são
organizadas em colunas e cada coluna contém um tipo específico de informação. Os dados
geralmente são estruturados por design. Você o coleta seletivamente e o registra em seu lugar
correto. Por exemplo, você pode querer colocar uma contagem do número de pessoas que compram
um determinado produto em uma coluna específica, em uma tabela específica, em um banco de
dados específico. Assim como em uma biblioteca, se você souber quais dados precisa, poderá
encontrá-los imediatamente.
Os dados não estruturados consistem em imagens, vídeos e gravações de som. Você pode usar um
formulário não estruturado para o texto para que possa marcá-lo com características, como tamanho,
data ou tipo de conteúdo. Normalmente, você não sabe exatamente onde os dados aparecem em um
conjunto de dados não estruturado porque os dados aparecem como sequências de uns e zeros que
um aplicativo deve interpretar ou visualizar.
Transformar dados não estruturados em um formato estruturado pode custar muito tempo e
esforço e pode envolver o trabalho de muitas pessoas. A maioria dos dados da revolução do big
data não é estruturada e é armazenada como está, a menos que alguém os torne estruturados.
Esse armazenamento de dados abundante e sofisticado não apareceu de repente da noite para
o dia. Levou tempo para desenvolver a tecnologia para armazenar essa quantidade de dados.
Além disso, demorou a difundir a tecnologia que gera e entrega dados, nomeadamente
computadores, sensores, telemóveis inteligentes, a Internet e os seus serviços World Wide
Web. As seções a seguir ajudam você a entender o que torna os dados um recurso universal
hoje.
22 PARTE 1Apresentando IA
Entendendo as implicações de Moore
Em 1965, Gordon Moore, cofundador da Intel e Fairchild Semiconductor, escreveu em um
artigo intitulado “Cramming More Components Onto Integrated Circuits”
(http://ieeexplore.ieee.org/document/4785860/)que o número de com-
componentes encontrados em circuitos integrados dobrariam a cada ano durante a próxima
década. Naquela época, os transistores dominavam a eletrônica. Ser capaz de inserir mais
transistores em um Circuito Integrado (IC) significava ser capaz de tornar os dispositivos
eletrônicos mais capazes e úteis. Este processo é chamado de integração e implica um forte
processo de miniaturização eletrônica (tornando o mesmo circuito muito menor). Os
computadores de hoje não são muito menores do que os computadores de uma década atrás,
mas são decididamente mais poderosos. O mesmo vale para telefones celulares. Embora
tenham o mesmo tamanho de seus antecessores, eles se tornaram capazes de realizar mais
tarefas.
O que Moore afirmou naquele artigo tem sido verdade por muitos anos. A indústria de
semicondutores a chama de Lei de Moore (vejahttp://www.mooreslaw.org/
para detalhes). A duplicação ocorreu nos primeiros dez anos, como previsto. Em 1975, Moore
corrigiu sua afirmação, prevendo uma duplicação a cada dois anos. A Figura 2-1 mostra os
efeitos dessa duplicação. Essa taxa de duplicação ainda é válida, embora agora seja opinião
comum que não durará mais do que o final da presente década (até cerca de 2020). A partir de
2012, começou a ocorrer um descompasso entre os aumentos de velocidade esperados e o que
as empresas de semicondutores podem alcançar em relação à miniaturização.
FIGURA 2-1:
Recheando mais e
mais transistores
em uma CPU.
A Lei de Moore tem um efeito direto nos dados. Começa com dispositivos mais inteligentes.
Quanto mais inteligentes os dispositivos, mais difusão (como evidenciado pela eletrônica estar
em toda parte hoje). Quanto maior a difusão, menor o preço, criando um loop infinito que
impulsiona o uso de poderosas máquinas de computação e pequenos sensores em todos os
lugares. Com grande quantidade de memória de computador disponível e discos maiores de
armazenamento de dados, as consequências são uma expansão da disponibilidade de dados,
como sites, registros de transações, medições, imagens digitais e outros tipos de dados.
Os cientistas precisam de computadores mais poderosos do que as pessoas comuns por causa de
seus experimentos científicos. Eles começaram a lidar com quantidades impressionantes de dados
anos antes de alguém cunhar o termo big data. A essa altura, a Internet não produzia a vasta
quantidade de dados que produz hoje. Lembre-se de que big data não é uma moda passageira criada
por fornecedores de software e hardware, mas tem base em muitos campos científicos, como
astronomia (missões espaciais), satélite (vigilância e monitoramento), meteorologia, física
(aceleradores de partículas) e genômica (DNA sequências).
A Internet agora gera e distribui novos dados em grandes quantidades. Nossa atual
produção diária de dados é estimada em cerca de 2,5 quintilhões (um número com 18
zeros) bytes, com a maior parte indo para dados não estruturados, como vídeos e áudios.
Todos esses dados estão relacionados a atividades, sentimentos, experiências e relações
humanas comuns. Percorrendo esses dados, uma IA pode facilmente aprender como
24 PARTE 1Apresentando IA
raciocinar e agir obras mais humanas. Aqui estão alguns exemplos dos dados mais
interessantes que você pode encontrar:
»As informações sobre como falamos são registradas por telefones celulares. Por exemplo, tudo bem
O Google, uma função encontrada em celulares Android, rotineiramente
registra perguntas e às vezes até mais:https://qz.com/526545/
googlesbeen-quietly-recording-your-voice-heres-how-to-listen-to-
anddelete-the-archive/.
Todos os dias, os usuários conectam ainda mais dispositivos à Internet que passam a
armazenar novos dados pessoais. Agora existem assistentes pessoais que ficam nas casas,
como o Amazon Echo e outros dispositivos domésticos inteligentes integrados que oferecem
maneiras de regular e facilitar o ambiente doméstico. Essas são apenas a ponta do iceberg
porque muitas outras ferramentas comuns da vida cotidiana estão se tornando
interconectadas (da geladeira à escova de dentes) e capazes de processar, registrar e transmitir
dados. A Internet das Coisas (IoT) está se tornando uma realidade. Especialistas estimam que,
até 2020, existirão seis vezes mais coisas conectadas do que pessoas, mas equipes de pesquisa
e grupos de reflexão já estão revisitando esses números (http://www.
gartner.com/newsroom/id/3165317).
FIGURA 2-2:
Com o presente
soluções de IA,
mais dados
equivale a mais
inteligência.
Assim, uma foto de alguns de seus gatinhos tornou-se cada vez mais útil não apenas por
causa de seu valor afetivo - retratando seus gatinhos fofos - mas porque pode se tornar
parte do processo de aprendizado de uma IA descobrindo conceitos mais gerais, como
quais características denotar um gato, ou entender o que define fofo.
Em uma escala maior, uma empresa como o Google alimenta seus algoritmos a partir de dados
disponíveis gratuitamente, como o conteúdo de sites ou o texto encontrado em livros e textos
disponíveis publicamente. O software spider do Google rastreia a web, pulando de site em site,
recuperando páginas da web com seu conteúdo de texto e imagens. Mesmo que o Google
devolva parte dos dados aos usuários como resultados de pesquisa, ele extrai outros tipos de
informações dos dados usando seus algoritmos de IA, que aprendem com eles como atingir
outros objetivos.
Algoritmos que processam palavras podem ajudar os sistemas de IA do Google a entender e antecipar
suas necessidades, mesmo quando você não as expressa em um conjunto de palavras-chave, mas em
linguagem natural simples e pouco clara, a linguagem que falamos todos os dias (e sim,
26 PARTE 1Apresentando IA
linguagem do dia-a-dia muitas vezes não é clara). Se você atualmente tenta fazer perguntas,
não apenas cadeias de palavras-chave, ao mecanismo de pesquisa do Google, notará que ele
tende a responder corretamente. Desde 2012, com a introdução da atualização Hummingbird
(http://searchengineland.com/google-hummingbird-172816),Google tornou-se
consegue entender melhor sinônimos e conceitos, algo que vai além dos dados iniciais
que adquiriu, e isso é resultado de um processo de IA. Existe um algoritmo ainda mais
avançado no Google, chamado RankBrain, que aprende diretamente com milhões de
consultas todos os dias e pode responder a consultas de pesquisa ambíguas ou pouco
claras, mesmo expressas em gírias ou termos coloquiais ou simplesmente cheias de
erros. O Rank-Brain não atende a todas as consultas, mas aprende com os dados como
responder melhor às consultas. Ele já lida com 15% das consultas do mecanismo e, no
futuro, esse percentual pode chegar a 100%.
Os dados também são coletados de sensores, e esses sensores podem assumir praticamente
qualquer forma. Por exemplo, muitas organizações baseiam a coleta de dados físicos, como o número
de pessoas que visualizam um objeto em uma janela, na detecção de celulares. O software de
reconhecimento facial pode potencialmente detectar clientes recorrentes.
Ainda assim, você não deseja dados tão fora do comum que se tornem quase assustadores de
revisar. O equilíbrio precisa ser mantido ao obter dados. Os dados devem caber dentro de
certos limites (conforme descrito na seção “Manipulando os dados”, mais adiante neste
capítulo). Ele também deve atender a critérios específicos quanto ao valor de verdade
(conforme descrito na seção “Considerando as cinco inverdades nos dados”, mais adiante neste
capítulo). Os dados também devem vir em intervalos esperados e todos os campos do registro
de dados recebidos devem ser preenchidos.
Até certo ponto, a segurança dos dados também afeta a confiabilidade dos dados. A consistência de
dados vem em várias formas. Quando os dados chegam, você pode garantir que eles estejam dentro
dos intervalos esperados e apareçam em um formulário específico. No entanto, depois de armazenar
os dados, a confiabilidade pode diminuir, a menos que você garanta que os dados permaneçam no
formato esperado. Uma entidade que mexe com os dados afeta a confiabilidade, tornando os dados
suspeitos e potencialmente inutilizáveis para análise posterior. Garantir a confiabilidade dos dados
significa que, após a chegada dos dados, ninguém os adultere para ajustá-los a um domínio esperado
(tornando-os mundanos como resultado).
28 PARTE 1Apresentando IA
assumem que os humanos de alguma forma não cometerão nenhum tipo de erro. O design
espera que todos simplesmente sigam as regras. Infelizmente, é garantido que a grande
maioria dos usuários nem mesmo lê as regras, porque a maioria dos humanos também é
preguiçosa ou pressionada pelo tempo quando se trata de fazer coisas que realmente não os
ajudam diretamente.
As caixas de listagem suspensas funcionam bem para uma incrível variedade de entradas de dados, e
usá-las garante que a entrada humana nesses campos se torne extremamente confiável porque o
humano não tem escolha a não ser usar uma das entradas padrão. Claro, o humano sempre pode
escolher a entrada incorreta, que é onde as checagens duplas entram em ação. Alguns aplicativos
mais recentes comparam o CEP com as entradas de cidade e estado para ver se correspondem.
Quando eles não correspondem, o usuário é solicitado novamente a fornecer a entrada correta. Essa
verificação dupla chega a ser irritante (consulte a barra lateral “Mais irritante do que auxílios de
entrada úteis” para obter detalhes), mas é improvável que o usuário a veja com muita frequência,
portanto, não deve se tornar muito irritante.
Mesmo com verificações cruzadas e entradas estáticas, os humanos ainda têm muito espaço
para cometer erros. Por exemplo, inserir números pode ser problemático. Quando um usuário
precisa inserir 2,00, você pode ver 2, ou 2,0, ou 2, ou qualquer uma de uma variedade de outras
entradas. Felizmente, analisar a entrada e reformatá-la resolverá o problema e você poderá
executar essa tarefa automaticamente, sem a ajuda do usuário.
Infelizmente, a reformatação não corrigirá uma entrada numérica errônea. Você pode mitigar parcialmente
esses erros incluindo verificações de intervalo. Um cliente não pode comprar -5 barras de sabão. A forma
legítima de mostrar ao cliente que está devolvendo as barras de sabão é processando uma devolução, não
uma venda. No entanto, o usuário pode simplesmente ter cometido um erro e você pode fornecer uma
mensagem informando o intervalo de entrada adequado para o valor.
»Melhor consistência
»Confiabilidade aprimorada
»Menor probabilidade de falta de dados
»Precisão aprimorada
»Variação reduzida para coisas como entradas cronometradas
Infelizmente, dizer que a coleta automatizada de dados resolve todos os problemas é simplesmente
incorreto. A coleta automatizada de dados ainda depende de sensores, aplicativos e hardware de
computador projetados por humanos que fornecem acesso apenas aos dados que os humanos
decidem permitir. Devido aos limites que os humanos impõem às características da coleta
automatizada de dados, o resultado geralmente fornece informações menos úteis do que o esperado
pelos projetistas. Consequentemente, a coleta automatizada de dados está em um estado de fluxo
constante à medida que os designers tentam resolver os problemas de entrada.
Manipulando os Dados
Algumas pessoas usam o termomanipulaçãoao falar sobre dados, dando a impressão de que
os dados são de alguma forma alterados de maneira inescrupulosa ou tortuosa. Talvez um
termo melhor seriamanicure,o que torna os dados bem modelados e adoráveis. Não importa
qual termo você use, no entanto, os dados brutos raramente atendem aos requisitos de
processamento e análise. Para obter algo dos dados, você deve manipulá-los para atender a
necessidades específicas. As seções a seguir discutem as necessidades de manipulação de
dados.
30 PARTE 1Apresentando IA
Lidando com dados perdidos
Para responder a uma determinada pergunta corretamente, você deve ter todos os fatos. Você pode
adivinhar a resposta para uma pergunta sem todos os fatos, mas então a resposta é tão provável que
esteja errada quanto correta. Freqüentemente, alguém que toma uma decisão, essencialmente
respondendo a uma pergunta, sem todos os fatos, chega a uma conclusão precipitada. Ao analisar
dados, você provavelmente já tirou mais conclusões do que pensa por causa da falta de dados. A
registro de dados,uma entrada em umconjunto de dados(que são todos os dados), consiste em
Camposque contêm fatos usados para responder a uma pergunta. Cada campo contém um único
tipo de dado que aborda um único fato. Se esse campo estiver vazio, você não tem os dados
necessários para responder à pergunta usando esse registro de dados específico.
Como parte do processo de lidar com dados ausentes, você deve saber que os dados estão ausentes.
Identificar que faltam informações em seu conjunto de dados pode, na verdade, ser bastante difícil
porque exige que você analise os dados em um nível baixo — algo que a maioria das pessoas não está
preparada para fazer e que consome tempo, mesmo que você tenha as habilidades necessárias.
Muitas vezes, sua primeira pista de que os dados estão faltando são as respostas absurdas que suas
perguntas obtêm do algoritmo e do conjunto de dados associado. Quando o algoritmo é o correto a
ser usado, o conjunto de dados deve estar com defeito.
Um problema pode ocorrer quando o processo de coleta de dados não inclui todos os dados
necessários para responder a uma pergunta específica. Às vezes, é melhor descartar um fato do que
usar um fato consideravelmente danificado. Se você descobrir que um campo específico em um
conjunto de dados está ausente em 90% ou mais de seus dados, o campo se torna inútil e você precisa
removê-lo do conjunto de dados (ou encontrar alguma maneira de obter todos esses dados).
Campos menos danificados podem ter dados ausentes de duas maneiras. Dados perdidos
aleatoriamente geralmente são resultado de erro humano ou do sensor. Ocorre quando os registros
de dados em todo o conjunto de dados têm entradas ausentes. Às vezes, uma simples falha causará o
dano. Dados sequencialmente ausentes ocorrem durante algum tipo de falha generalizada. Um
segmento inteiro dos registros de dados no conjunto de dados carece das informações necessárias, o
que significa que a análise resultante pode se tornar bastante distorcida.
Corrigir dados ausentes aleatoriamente é mais fácil. Você pode usar uma mediana simples ou um
valor médio como substituto. Não, o conjunto de dados não é totalmente preciso, mas provavelmente
funcionará bem o suficiente para obter uma resposta razoável. Em alguns casos, os cientistas de
dados usaram um algoritmo especial para calcular o valor ausente, o que pode tornar o conjunto de
dados mais preciso em detrimento do tempo computacional.
alinhados com outros dados em outros conjuntos de dados de sua propriedade. Por exemplo, os dados numéricos em
um campo em um conjunto de dados podem ser um tipo de ponto flutuante (com ponto decimal), mas um tipo inteiro
em outro conjunto de dados. Antes de combinar os dois conjuntos de dados, os campos devem conter o mesmo tipo de
dados.
Todos os outros tipos de desalinhamento podem ocorrer. Por exemplo, os campos de data são
notórios por serem formatados de várias maneiras. Para comparar datas, os formatos de dados
devem ser os mesmos. No entanto, as datas também são insidiosas em sua propensão a
parecer iguais, mas não são as mesmas. Por exemplo, datas em um conjunto de dados podem
usar Greenwich Mean Time (GMT) como base, enquanto as datas em outro conjunto de dados
podem usar algum outro fuso horário. Antes de comparar os horários, você deve alinhá-los
com o mesmo fuso horário. Pode ficar ainda mais estranho quando as datas em um conjunto
de dados vêm de um local que usa o horário de verão (DST), mas as datas de outro local não.
Mesmo quando os tipos e formatos de dados são os mesmos, outros desalinhamentos de dados
podem ocorrer. Por exemplo, os campos de um conjunto de dados podem não corresponder aos
campos do outro conjunto de dados. Em alguns casos, essas diferenças são fáceis de corrigir. Um
conjunto de dados pode tratar nome e sobrenome como um único campo, enquanto outro conjunto
de dados pode usar campos separados para nome e sobrenome. A resposta é alterar todos os
conjuntos de dados para usar um único campo ou alterá-los todos para usar campos separados para
nome e sobrenome. Infelizmente, muitos desalinhamentos no conteúdo de dados são mais difíceis de
descobrir. Na verdade, é perfeitamente possível que você não consiga entendê-los. No entanto, antes
de desistir, considere estas possíveis soluções para o problema:
32 PARTE 1Apresentando IA
encontrar a solução (depois de percorrer todos esses dados extras) leva mais tempo e, às vezes, você
obtém resultados confusos porque não consegue ver a floresta por causa das árvores.
Como parte da criação do conjunto de dados necessário para análise, você faz uma cópia dos dados
originais em vez de modificá-los. Sempre mantenha os dados brutos originais puros para que você
possa usá-los para outras análises posteriormente. Além disso, criar a saída de dados correta para
análise pode exigir várias tentativas porque você pode descobrir que a saída não atende às suas
necessidades. O objetivo é criar um conjunto de dados que contenha apenas os dados necessários
para análise, mas tendo em mente que os dados podem precisar de tipos específicos de poda para
garantir a saída desejada.
As seções a seguir usam um acidente de carro como exemplo principal para ilustrar cinco
tipos de inverdades que podem aparecer nos dados. Os conceitos que o acidente está
tentando retratar nem sempre aparecem nos dados e podem aparecer de maneiras
diferentes das discutidas. O fato é que você normalmente precisa lidar com esse tipo de
coisa ao visualizar dados.
Comissão
Erros de comissão são aqueles que refletem uma tentativa direta de substituir
informações verdadeiras por informações falsas. Por exemplo, ao preencher um relatório
de acidente, alguém poderia afirmar que o sol o cegou momentaneamente,
Embora pareça que inverdades de comissão são completamente evitáveis, muitas vezes
não são. O ser humano conta “mentirinhas” para evitar o constrangimento dos outros ou
para lidar com um problema com o mínimo de esforço pessoal. Às vezes, uma inverdade
de comissão é baseada em informações errôneas ou boatos. Na verdade, as fontes de
erros de comissão são tantas que é realmente difícil criar um cenário em que alguém
possa evitá-los totalmente. Tudo isso dito, inverdades de comissão são um tipo de
inverdade que alguém pode evitar com mais frequência do que não.
Omissão
Inverdades de omissão são aquelas em que uma pessoa diz a verdade em cada fato declarado,
mas deixa de fora um fato importante que mudaria a percepção de um incidente como um
todo. Pensando novamente no relatório do acidente, diga que alguém atropelou um veado,
causando danos significativos ao carro. Ele diz com sinceridade que a estrada estava molhada;
era quase crepúsculo, então a luz não era tão boa quanto poderia ser; ele demorou um pouco
para pisar no freio; e o cervo simplesmente saiu correndo de um matagal ao lado da estrada. A
conclusão seria que o incidente é simplesmente um acidente.
Evitar inverdades de omissão é quase impossível. Sim, alguém pode deixar propositalmente
fatos fora de um relatório, mas é igualmente provável que alguém simplesmente se esqueça de
incluir todos os fatos. Afinal, a maioria das pessoas fica bastante abalada após um acidente, por
isso é fácil perder o foco e relatar apenas as verdades que deixaram a impressão mais
significativa. Mesmo que uma pessoa mais tarde se lembre de detalhes adicionais e os relate, é
improvável que o banco de dados contenha um conjunto completo de verdades.
Perspectiva
Erros de perspectiva ocorrem quando várias partes veem um incidente de vários pontos
de vista. Por exemplo, ao considerar um acidente envolvendo um pedestre atropelado, a
pessoa que dirige o carro, a pessoa que foi atropelada e um espectador que
testemunhou o evento teriam perspectivas diferentes.
34 PARTE 1Apresentando IA
Um policial recebendo relatórios de cada pessoa entenderia fatos diferentes de cada um,
mesmo assumindo que cada pessoa diz a verdade como cada um sabe. De fato, a
experiência mostra que quase sempre é assim e o que o policial apresenta como relatório
é o meio-termo do que cada um dos envolvidos afirma, acrescido da experiência pessoal.
Em outras palavras, o relatório estará próximo da verdade, mas não o suficiente para
uma IA.
A perspectiva é talvez a mais perigosa das inverdades porque quem tentar derivar a verdade
neste cenário acabará, na melhor das hipóteses, com uma média das várias histórias, que
nunca estará totalmente correta. Um ser humano que visualiza as informações pode confiar na
intuição e no instinto para potencialmente obter uma melhor aproximação da verdade, mas
uma IA sempre usará apenas a média, o que significa que a IA está sempre em desvantagem
significativa. Infelizmente, evitar inverdades de perspectiva é impossível porque não importa
quantas testemunhas você tenha do evento, o melhor que você pode esperar conseguir é uma
aproximação da verdade, não a verdade real.
Viés
Inverdades de preconceito ocorrem quando alguém é capaz de ver a verdade, mas devido a
preocupações ou crenças pessoais é incapaz de realmente vê-la. Por exemplo, ao pensar em
um acidente, um motorista pode concentrar a atenção tão completamente no meio da estrada
que o cervo na beira da estrada fica invisível. Conseqüentemente, o motorista
Um problema com o viés é que pode ser incrivelmente difícil de categorizar. Por exemplo, um
motorista que não consegue ver o cervo pode sofrer um acidente genuíno, o que significa que
o cervo foi escondido por arbustos. No entanto, o motorista também pode ser culpado de
dirigir desatento devido ao foco incorreto. O motorista também pode experimentar uma
distração momentânea. Em suma, o fato de o motorista não ter visto o veado não é a questão;
em vez disso, é uma questão de por que o motorista não viu o cervo. Em muitos casos,
confirmar a origem do viés torna-se importante ao criar um algoritmo projetado para evitar
uma fonte de viés.
Quadro de Referência
Das cinco inverdades, o quadro de referência não precisa ser realmente o resultado de
qualquer tipo de erro, mas de entendimento. Uma inverdade do quadro de referência ocorre
quando uma das partes descreve algo, como um evento como um acidente, e porque uma
segunda parte não tem experiência com o evento, os detalhes tornam-se confusos ou
completamente incompreendidos. São abundantes as rotinas de comédia que dependem de
erros de quadro de referência. Um exemplo famoso é de Abbott e Costello,Quem é o primeiro?,
como mostrado emhttps://www.youtube.com/watch?v=kTcRRaXV-fg.Conseguir um
pessoa entender o que uma segunda pessoa está dizendo pode ser impossível quando a
primeira pessoa carece de conhecimento experiencial - o quadro de referência.
Outro exemplo de inverdade do quadro de referência ocorre quando uma das partes não
consegue entender a outra. Por exemplo, um marinheiro experimenta uma tempestade no
mar. Talvez seja uma monção, mas assuma por um momento que a tempestade é forte - talvez
com risco de vida. Mesmo com o uso de vídeos, entrevistas e um simulador, a experiência de
estar no mar em uma tempestade com risco de vida seria impossível de transmitir a alguém
que não vivenciou uma tempestade em primeira mão; essa pessoa não tem quadro de
referência.
A melhor maneira de evitar inverdades sobre quadros de referência é garantir que todas as partes
envolvidas possam desenvolver quadros de referência semelhantes. Para realizar esta tarefa, as várias
partes requerem conhecimentos experimentais semelhantes para garantir a transferência precisa de
dados de uma pessoa para outra. No entanto, ao trabalhar com um conjunto de dados, que é
necessariamente gravado, dados estáticos, erros de quadro de referência ainda ocorrerão quando o
visualizador em potencial não tiver o conhecimento experiencial necessário.
36 PARTE 1Apresentando IA
Uma IA sempre experimentará problemas de quadro de referência porque uma IA necessariamente
carece da capacidade de criar uma experiência. Um banco de dados de conhecimento adquirido não é
exatamente a mesma coisa. O banco de dados conteria fatos, mas a experiência é baseada não
apenas em fatos, mas também em conclusões que a tecnologia atual é incapaz de reproduzir.
A lista poderia continuar, mas a ideia é criar uma lista de perguntas que abordem necessidades
específicas do negócio. Depois de criar uma lista, você deve verificar se cada uma das
perguntas é realmente importante - ou seja, atende a uma necessidade - e, em seguida,
verificar que tipo de informação você precisa para responder à pergunta.
Obviamente, tentar coletar todos esses dados manualmente seria impossível, e é aí que entra a
automação. Aparentemente, a automação produziria entrada de dados confiável, repetível e
consistente. No entanto, muitos fatores na automatização da aquisição de dados podem
produzir dados que não são particularmente úteis. Por exemplo, considere estas questões:
»Os sensores podem coletar apenas os dados para os quais foram projetados, então você pode
dados perdidos quando os sensores utilizados não foram concebidos para o efeito.
»As pessoas criam dados errôneos de várias maneiras (consulte a seção “Considerando os Cinco
Mistruths in Data” do capítulo para detalhes), o que significa que os dados que você
recebe podem ser falsos.
»Os dados podem ficar distorcidos quando as condições para coletá-los são incorretas
definiram.
Muitas outras questões precisam ser consideradas (o suficiente para encher um livro). Quando você
combina dados malformados e mal coletados com algoritmos que não respondem de fato às suas
perguntas, obtém uma saída que pode realmente levar seus negócios na direção errada, e é por isso
que a IA costuma ser responsabilizada por resultados inconsistentes ou não confiáveis. Fazer a
pergunta certa, obter os dados corretos, realizar o processamento correto e, em seguida, analisar
corretamente os dados são requisitos necessários para tornar a aquisição de dados o tipo de
ferramenta em que você pode confiar.
38 PARTE 1Apresentando IA
NESTE CAPÍTULO
Capítulo3
Considerando o Uso
de Algoritmos
D
ata é uma virada de jogo na IA. Avanços recentes em IA sugerem que, para
alguns problemas, escolher a quantidade certa de dados é mais importante do
que o algoritmo certo. Por exemplo, em 2001, dois pesquisadores da Microsoft,
Banko e Brill, em seu memorável artigo “Scaling to Very Very Large Corpora for
Desambiguação da Linguagem Natural” (http://www.aclweb.org/anthology/P01-
1005)demonstrou que, se você deseja que um computador crie um modelo de linguagem, não
precisa do algoritmo mais inteligente da cidade. Depois de lançar mais de um bilhão de
palavras dentro do contexto do problema, qualquer algoritmo começará a ter um desempenho
incrivelmente bom. Este capítulo ajuda você a entender a relação entre os algoritmos e os
dados usados para fazê-los realizar um trabalho útil.
No entanto, não importa quantos dados você tenha, você ainda precisa de um algoritmo para torná-
los úteis. Além disso, você deve realizaranálise de dados(uma série de etapas definíveis), para fazer os
dados funcionarem corretamente com os algoritmos escolhidos. Você não pode pegar nenhum
atalho. Embora a IA seja uma automação inteligente, às vezes a automação deve ficar em segundo
plano em relação à análise. Máquinas que aprendem sozinhas estão em um futuro distante. Você não
encontrará máquinas que saibam o que é apropriado e possam cortar completamente qualquer
intervenção humana hoje. A segunda metade deste capítulo ajuda você a entender o papel dos
sistemas especialistas, aprendizado de máquina, aprendizado profundo e aplicativos como o AlphaGo
em trazer possibilidades futuras um pouco mais próximas da realidade.
Este é claramente oefeito de IA,conforme nomeado e descrito por Pamela McCorduck, uma
autora americana que escreveu uma história notável da IA em 1979. O efeito da IA afirma
que programas de computador inteligentes bem-sucedidos logo perdem o reconhecimento das
pessoas e se tornam atores silenciosos, enquanto a atenção se volta para problemas de IA que
ainda exigem resolução. As pessoas não percebem a importância dos algoritmos clássicos para
a IA e começam a fantasiar sobre a IA criada a partir de tecnologia esotérica ou igualando-a a
avanços recentes, como aprendizado de máquina e aprendizado profundo.
Entendendo o quealgoritmosignifica
Um algoritmo sempre apresenta uma série de etapas, mas não necessariamente executa todas
essas etapas para resolver um problema. O escopo dos algoritmos é incrivelmente grande. As
operações podem envolver armazenar dados, explorá-los e ordená-los ou organizá-los em
estruturas de dados. Você pode encontrar algoritmos que resolvem problemas em ciência,
medicina, finanças, produção e fornecimento industrial e comunicação.
Todos os algoritmos são sequências de operações para encontrar a solução correta para um
problema em um tempo razoável (ou relatar se nenhuma solução for encontrada). Os
algoritmos de IA se distinguem dos algoritmos genéricos por resolver problemas cuja
resolução é considerada tipicamente (ou mesmo exclusivamente) o produto do comportamento
inteligente humano. Os algoritmos de IA tendem a lidar com problemas complexos, que
geralmente fazem parte da classe de problemas NP-completos (onde NP é tempo polinomial
não determinístico) com os quais os humanos lidam rotineiramente usando uma mistura de
abordagem racional e intuição. Aqui estão alguns exemplos:
40 PARTE 1Apresentando IA
»Agendar problemas e alocar recursos escassos
»Buscando rotas em espaços físicos ou figurativos complexos
»Reconhecer padrões na visão de imagem (em vez de algo como restauração de imagem
ou processamento de imagem) ou percepção sonora
Construir uma árvore funciona como construir uma árvore no mundo físico. Cada item
adicionado à árvore é umnó.Os nós se conectam uns aos outros usando links. A combinação de
nós e links forma uma estrutura que se parece com uma árvore, conforme mostrado na Figura
3-1.
As árvores têm um nó raiz, assim como uma árvore física. Onó raizé o ponto de partida
para o processamento que você executa. Conectados à raiz estão ramos ou folhas. ANó
da folhaé um ponto final para a árvore.Nós de ramificaçãosustentam outros ramos ou
folhas. O tipo de árvore mostrado na Figura 3-1 é uma árvore binária porque cada nó
tem, no máximo, duas conexões (mas as árvores que representam espaços de estado
podem ter vários ramos).
Olhando para a árvore, o Ramo B é ocriançado nó Raiz. Isso ocorre porque o nó Raiz
aparece primeiro na lista. A Folha E e a Folha F são filhas do Ramo B, tornando o Ramo B
opaida Folha E e da Folha F. O relacionamento entre os nós é importante porque as
discussões sobre árvores geralmente consideram o relacionamento filho/pai entre os
nós. Sem esses termos, as discussões sobre árvores podem se tornar bastante confusas.
Agráficoé uma espécie de extensão de árvore. Assim como nas árvores, você tem nós que se
conectam uns aos outros para criar relacionamentos. No entanto, ao contrário das árvores binárias,
um nó gráfico pode ter mais de uma ou duas conexões. Na verdade, os nós do grafo geralmente têm
uma infinidade de conexões e, mais importante, os nós podem se conectar em qualquer direção, não
apenas de pai para filho. Para manter as coisas simples, porém, considere o gráfico mostrado na
Figura 3-2.
42 PARTE 1Apresentando IA
FIGURA 3-2:
Os nós do gráfico podem
conectar a
um ao outro em
inúmeras maneiras.
Grafos são estruturas que apresentam um número de nós (ou vértices) conectados por
um número de arestas ou arcos (dependendo da representação). Quando você pensar
em um gráfico, pense em uma estrutura como um mapa, onde cada localização no mapa
é um nó e as ruas são as arestas. Essa apresentação difere de uma árvore, onde cada
caminho termina em um nó folha. Consulte a Figura 3-2 para ver um gráfico
representado. Os gráficos são particularmente úteis ao descobrir estados que
representam uma espécie de espaço físico. Por exemplo, o GPS usa um gráfico para
representar lugares e ruas.
Os gráficos também adicionam algumas novas reviravoltas que você pode não ter considerado. Por
exemplo, um gráfico pode incluir o conceito de direcionalidade. Ao contrário de uma árvore, que tem
relacionamentos pai/filho, um nó gráfico pode se conectar a qualquer outro nó com uma direção
específica em mente. Pense nas ruas de uma cidade. A maioria das ruas é bidirecional, mas algumas
são ruas de mão única que permitem o movimento em apenas uma direção.
Percorrer um grafo significa pesquisar (visitar) cada vértice (nó) em uma ordem
específica. O processo de visitar um vértice pode incluir tanto a leitura quanto a
atualização do mesmo. Você descobre vértices não visitados ao percorrer um grafo. O
vértice é descoberto (porque você acabou de visitá-lo) ou processado (porque o algoritmo
tentou todas as arestas que partem dele) após a busca. A ordem da busca determina o
tipo de busca realizada: desinformada (busca cega) e informada (heurística). No
desinformadoestratégia, a IA explora o espaço de estado sem informações adicionais,
exceto a estrutura do grafo que descobre ao atravessá-lo. As seções a seguir discutem
dois algoritmos comuns de busca cega: busca em largura e busca em profundidade.
Uma pesquisa em largura (BFS) começa na raiz do grafo e explora cada nó que se conecta
à raiz. Em seguida, ele procura o próximo nível, explorando cada nível sucessivamente
até chegar ao fim. Conseqüentemente, no grafo de exemplo, a busca explora de A a B e C
antes de passar a explorar D. BFS explora o grafo de forma sistemática, explorando
vértices ao redor do vértice inicial de forma circular. Começa visitando todos os vértices a
um passo do vértice inicial; em seguida, move-se dois passos para fora, depois três
passos para fora e assim por diante.
Uma pesquisa em profundidade (DFS) começa na raiz do gráfico e, em seguida, explora todos os nós
dessa raiz em um único caminho até o final. Em seguida, ele retrocede e começa a explorar os
caminhos não percorridos no caminho de pesquisa atual até atingir a raiz novamente. Nesse ponto, se
outros caminhos a serem percorridos a partir da raiz estiverem disponíveis, o algoritmo escolhe um e
inicia a mesma busca novamente. A ideia é explorar cada caminho completamente antes de explorar
qualquer outro caminho.
Você tem nove células para preencher com X's e O's para cada jogador. O primeiro a
colocar três marcas seguidas (horizontal, vertical ou diagonal) vence. Ao construir um
44 PARTE 1Apresentando IA
árvore de espaço de estado para a árvore, cada nível da árvore representa um turno de
jogo. Os nós finais representam o estado final do tabuleiro e determinam uma vitória,
empate ou derrota para a IA. Cada nó terminal tem uma pontuação maior para vitória,
menor para empate e ainda menor ou negativa para derrota. O AI propaga as
pontuações para os nós superiores e ramos usando somatório até atingir o nó inicial. O
nó inicial representa a situação real. O uso de uma estratégia simples permite que você
percorra a árvore: quando é a vez da IA e você precisa propagar os valores de muitos
nós, você soma o valor máximo (presumivelmente porque a IA deve obter o resultado
máximo do jogo); quando é a vez do adversário, você soma o valor mínimo. No final, você
obtém uma árvore cujos galhos são qualificados por pontuações. Quando for a vez da IA,
ele escolhe seu movimento com base no galho cujo valor é o mais alto, porque implica
expandir os nós com maior possibilidade de vencer. A Figura 3-3 mostra um exemplo
visual dessa estratégia.
FIGURA 3-3:
Uma olhada em
mínimo máximo
aproximação em
um jogo da velha
jogo.
Damas, um jogo relativamente simples comparado ao xadrez ou ao Go, tem 500 bilhões de
bilhões (500 bilhões de bilhões) de posições possíveis no tabuleiro, um número que, de acordo
com os cálculos dos matemáticos da Universidade do Havaí, equivale a todos os grãos de areia
da Terra. É verdade que menos movimentos são possíveis à medida que um jogo de damas
progride. No entanto, o número a avaliar potencialmente em cada movimento é muito alto.
Demorou 18 anos usando computadores poderosos (http://sciencenetlinks.com/
notícias científicas/atualizações científicas/damas resolvidas/)para calcular todos os 500 bilhões
bilhões de movimentos possíveis. Imagine quanto tempo poderia levar para o computador de um consumidor
realizar até mesmo um subconjunto menor de movimentos. Para ser administrável, deve ser um subconjunto
muito pequeno de todos os movimentos potenciais.
A otimização usando pesquisa local e heurística ajuda usando restrições para limitar o número
inicial de avaliações possíveis (como na poda alfa, onde alguns cálculos são deixados de fora
porque não acrescentam nada ao sucesso da pesquisa). Pesquisa localé uma abordagem geral
de resolução de problemas que compreende uma grande variedade de algoritmos que ajudam
você a escapar das complexidades exponenciais de muitos problemas NP. Uma busca local
começa a partir de sua situação atual ou de uma solução de problema imperfeita e se afasta
dela, um passo de cada vez. Uma busca local determina a viabilidade de soluções próximas,
potencialmente levando a uma solução perfeita, com base na escolha aleatória ou em uma
heurística astuta (o que significa que nenhum método exato está envolvido).
Aheurísticoé um palpite sobre uma solução, como uma regra prática que aponta a direção de
um resultado desejado, mas não pode dizer exatamente como alcançá-lo. É como estar perdido
em uma cidade desconhecida e ter pessoas lhe dizendo um certo caminho para chegar ao seu
hotel (mas sem instruções precisas) ou a que distância você está dele.
46 PARTE 1Apresentando IA
intuitivo, projetar uma abordagem de busca local para um problema algorítmico não é
difícil; torná-lo eficaz é geralmente mais difícil. A chave é definir o procedimento correto:
1.Comece com uma situação existente (pode ser a situação atual ou uma solução aleatória
ou conhecida).
3.Determine qual solução usar no lugar da solução atual com base na saída de
uma heurística que aceita a lista de candidatos como entrada.
Embora fáceis de projetar, as soluções de busca local podem não encontrar uma solução em
um tempo razoável (você pode interromper o processo e usar a solução atual) ou produzir uma
solução de qualidade mínima. Você não tem garantia de que uma pesquisa local chegará à
solução do problema, mas suas chances aumentam a partir do ponto de partida, quando você
fornece tempo suficiente para que a pesquisa execute seus cálculos. Ele só para depois de não
encontrar mais nenhuma maneira de melhorar a solução. O segredo é determinar o bairro
certo para explorar. Se você explorar tudo, cairá em uma busca exaustiva, o que implica uma
explosão de possibilidades para explorar e testar.
Basear-se em limites heurísticos onde você olha com base em uma regra de ouro. Às vezes, uma
heurística é aleatoriedade e tal solução, apesar de ser uma abordagem não inteligente, pode
funcionar bem. Poucas pessoas, por exemplo, sabem que o Roomba, o aspirador de pó robótico
autônomo criado por três graduados do MIT, inicialmente não planejou seu caminho de limpeza, mas
simplesmente perambulou aleatoriamente. No entanto, foi considerado um dispositivo inteligente por
seus proprietários e fez um excelente trabalho de limpeza. (Na verdade, a inteligência está na ideia de
usar a aleatoriedade para resolver um problema que, de outra forma, é muito complexo.)
A escolha aleatória não é a única heurística disponível. Uma busca local pode contar com
soluções de exploração mais fundamentadas usando heurísticas bem elaboradas para obter
direções, como emotimização de subidaougiro,e evitar a armadilha de aceitar soluções
medíocres, como emrecozimento simuladoepesquisa tabu. Otimização de escalada, giro,
recozimento simulado e pesquisa tabu são todos algoritmos de pesquisa que usam heurísticas
de forma eficaz para obter orientação.
A busca tabu usa a memorização para lembrar quais partes da vizinhança explorar.
Quando parece ter encontrado uma solução, tende a tentar refazer por outros caminhos
possíveis que não tentou para averiguar a melhor solução.
Usar medidas de direção (para cima, para baixo), temperatura (aleatoriedade controlada)
ou simplesmente restringir ou refazer parte da busca são formas de efetivamente evitar
tentar de tudo e se concentrar em uma boa solução. Considere, por exemplo, um robô
andando. Guiar um robô em um ambiente desconhecido significa evitar obstáculos para
atingir um alvo específico. É uma tarefa fundamental e desafiadora em inteligência
artificial. Os robôs podem contar com telêmetro a laser (LIDAR) ou sonar (que envolve
dispositivos que usam som para ver seu ambiente) para navegar em seus arredores. No
entanto, não importa o nível de sofisticação do hardware, os robôs ainda precisam de
algoritmos adequados para
»Encontre o caminho mais curto para um destino (ou pelo menos razoavelmente curto)
»Evite obstáculos no caminho
»Execute comportamentos personalizados, como minimizar curvas ou frenagens
48 PARTE 1Apresentando IA
Um algoritmo de descoberta de caminhos ajuda um robô a começar em um local e atingir um
objetivo usando o caminho mais curto entre os dois, antecipando e evitando obstáculos ao
longo do caminho. (Reagir depois de bater em uma parede não é suficiente.) Pathfinding
também é útil ao mover qualquer outro dispositivo para um alvo no espaço, mesmo um virtual,
como em um videogame ou páginas da web. Ao usar pathfinding com um robô, o robô percebe
o movimento como um fluxo de espaços de estado para as bordas de seus sensores. Se o alvo
não estiver dentro do alcance, o robô não saberá para onde ir. A heurística pode apontá-lo na
direção certa (por exemplo, ele pode saber que o alvo está na direção norte) e ajudá-lo a evitar
obstáculos em tempo hábil, sem ter que determinar todas as maneiras possíveis de fazê-lo.
Todos os exemplos algorítmicos até agora estão associados à IA porque são soluções inteligentes que
resolvem problemas repetitivos e bem delimitados, mas complexos, que requerem inteligência. Eles
exigem um arquiteto que estude o problema e escolha o algoritmo certo para resolvê-lo. Mudanças de
problemas, mutações ou exibições de características incomuns podem se tornar um problema real
para uma execução bem-sucedida do algoritmo. Isso porque o aprendizado do problema e sua
solução ocorrem de vez no momento em que o algoritmo aparece no software. Por exemplo, você
pode programar com segurança uma IA para resolver o Sudoku (um jogo popular que exige que você
coloque números em um tabuleiro
de acordo com certas regras:https://www.learn-sudoku.com/what-is-sudoku.
html).Você pode até fornecer flexibilidade que permita ao algoritmo aceitar mais regras ou
quadros maiores posteriormente. Peter Norvig, diretor de pesquisa do Google, escreveu um
ensaio extremamente interessante sobre esse tópico (http://norvig.com/sudoku. html)isso
demonstra como o uso inteligente da pesquisa em profundidade, limitando o número de
cálculos (caso contrário, os cálculos podem demorar uma eternidade), usando restrições e
explorando ramificações menores primeiro, podem tornar possíveis as soluções de Sudoku.
Infelizmente, nem todos os problemas podem contar com uma solução semelhante ao Sudoku. Os
problemas da vida real nunca são definidos em mundos simples de informações perfeitas e ações
bem definidas. Considere o problema de encontrar um fraudador trapaceando em reivindicações de
seguro ou o problema de diagnosticar uma doença médica:
»As regras do problema não são imutáveis:Fraudadores descobrem novas maneiras de organizar
trapaças ou fraudes; novas doenças surgem ou são descobertas.
Os sistemas especialistas eram especialistas não porque baseavam seu conhecimento em seu próprio
processo de aprendizado, mas porque o coletavam de especialistas humanos que forneciam um
sistema pré-digerido de informações importantes tiradas de livros de estudo, aprendendo com outros
especialistas ou descobrindo por si mesmos. Foi basicamente uma maneira inteligente de externalizar
o conhecimento em uma máquina.
Escrito em LisP como uma dissertação de doutorado por Edward Shortliffe na Universidade de
Stanford, o MYCIN levou mais de cinco anos para ser concluído e teve um desempenho melhor do que
qualquer médico iniciante, alcançando a elevada precisão de diagnóstico de um médico experiente.
Veio do mesmo laboratório que idealizou o DENDRAL, o primeiro sistema especialista já criado, alguns
anos antes. A DENDRAL, especializada em química orgânica, é uma aplicação desafiadora na qual os
algoritmos de força bruta se mostraram inviáveis quando confrontados com heurísticas baseadas em
humanos que dependem da experiência de campo.
Quanto ao sucesso do MYCIN, surgiram alguns problemas. Primeiro, os termos de responsabilidade não eram
claros. (Se o sistema fornecesse um diagnóstico errado, quem assumiria a responsabilidade?) Em segundo
lugar, o MYCIN tinha um problema de usabilidade porque o médico tinha que se conectar ao MYCIN usando
um terminal remoto para o mainframe em Stanford, algo bastante
50 PARTE 1Apresentando IA
difícil e lento em uma época em que a Internet ainda estava em sua infância. O MYCIN
ainda provou sua eficácia e utilidade no suporte a decisões humanas e abriu caminho
para muitos outros sistemas especialistas que proliferaram nas décadas de 1970 e 1980.
Como o sistema foi feito no centro de uma série de ifs (condições) e thens (conclusões) e
foi aninhado e estruturado em camadas, a aquisição de informações iniciais ajudou a
descartar algumas conclusões e também ajudou o sistema a interagir com o usuário
sobre as informações que poderia levar a uma resposta. Ao lidar com o motor de
inferência, as operações comuns dos sistemas especialistas foram as seguintes:
uma conclusão final por disparo. Essa abordagem é claramente orientada por dados.
»Como os dados estavam se tornando mais difusos e disponíveis, fazia pouco sentido
lutam para entrevistar, reunir e destilar cuidadosamente o conhecimento especializado raro
quando o mesmo (ou até melhor) conhecimento pode ser filtrado dos dados.
Os sistemas especialistas ainda existem. Você pode encontrá-los usados em pontuação de crédito, detecção
de fraude e outros campos com o imperativo de não apenas fornecer uma resposta, mas também declarar de
forma clara e transparente as regras por trás da decisão de uma forma que o usuário do sistema considere
aceitável (como um especialista no assunto faria fazer).
52 PARTE 1Apresentando IA
mencionado em quase todos os capítulos deste livro, mas os capítulos 9 a 11 são dedicados a revelar
como os principais algoritmos de aprendizado de máquina funcionam, especialmente o aprendizado
profundo, que é a tecnologia que alimenta a nova onda de aplicativos de IA que chega às manchetes
dos jornais quase todos os dias.
Go é um jogo incrivelmente complexo para uma IA. O xadrez tem uma média de 35
movimentos possíveis para avaliar em um tabuleiro, e um jogo geralmente abrange mais de 80
movimentos, enquanto um jogo de Go tem cerca de 140 movimentos para avaliar e um jogo
geralmente abrange mais de 240 movimentos. Atualmente, não existe poder computacional no
mundo para criar um estado-espaço completo para um jogo de Go. A equipe DeepMind do
Google em Londres desenvolveu o AlphaGo, um programa que derrotou vários dos melhores
Vá jogadores (vejahttps://deepmind.com/research/alphago/).O programa
não depende de uma abordagem algorítmica baseada na pesquisa de um imenso espaço
de estado, mas usa o seguinte:
»Um algoritmo de aprendizado profundo processa uma imagem do quadro (à primeira vista) e
deriva tanto o melhor movimento possível naquela situação (o algoritmo é chamado de
rede política) e uma estimativa da probabilidade de a IA vencer o jogo usando esse
movimento (o algoritmo é chamado derede de valor).
Capítulo4
Pioneirismo Especializado
hardware
EU
No Capítulo 1, você descobre que uma das razões para o fracasso dos primeiros esforços de IA foi a
falta de hardware adequado. O hardware simplesmente não conseguia executar tarefas com
rapidez suficiente nem para necessidades mundanas, muito menos para algo tão complexo quanto
simular o pensamento humano. Esse problema é descrito com certa extensão no movimento
O jogo da imitação(https://www.amazon.com/exec/obidos/ASIN/B00RY86HSU/
datacservip0f-20/),em que Alan Turing finalmente decifrou o código Enigma procurando
habilmente por uma frase específica, “Heil Hitler”, em cada mensagem. Sem essa falha
específica na maneira como os operadores usaram o Enigma, o equipamento de
computador que Turing usou nunca teria funcionado rápido o suficiente para resolver o
problema (e o movimento não teve pouca reclamação sobre o assunto). De qualquer
forma, o relato histórico - o pouco dele é totalmente desclassificado - mostra que os
problemas de Turing eram mais profundos do que o filme expressava (verhttps://
www.scienceabc.com/innovation/cracking-the-uncrackable-how-did-alanturing-and-
his-team-crack-the-enigma-code.htmlpara detalhes). Felizmente,
hardware padrão, pronto para uso, pode superar o problema de velocidade para muitos
problemas hoje, que é onde este capítulo começa.
Mesmo com hardware personalizado especialmente projetado para acelerar cálculos, uma
máquina projetada para simular o pensamento humano pode funcionar tão rápido quanto suas
entradas e saídas permitirem. Consequentemente, as pessoas estão trabalhando para criar um
ambiente melhor no qual o hardware possa operar. Essa necessidade pode ser abordada de
várias maneiras, mas este capítulo aborda duas: aprimorar os recursos do hardware subjacente
e usar sensores especializados. Essas mudanças no ambiente de hardware funcionam bem,
mas, como explica o material a seguir, ainda não é suficiente para construir um cérebro
humano.
Em última análise, o hardware é inútil, mesmo com melhorias, se os humanos que dependem
dele não puderem interagir com ele de forma eficaz. A seção final deste capítulo descreve
técnicas para tornar essas interações mais eficientes. Essas interações são simplesmente o
resultado da combinação de saída aprimorada e programação inteligente. Assim como Alan
Turning usou um truque para fazer seu computador aparentemente fazer mais do que era
capaz de fazer, essas técnicas fazem os computadores modernos parecerem milagres. Na
verdade, o computador não entende nada; todo o crédito vai para as pessoas que programam
o computador.
56 PARTE 1Apresentando IA
Arquitetura Neumann porque essa arquitetura oferece benefícios significativos em modularidade. A
leitura do histórico informa que esses dispositivos permitem atualizações para todos os componentes
como decisões individuais, permitindo aumentos emcapacidade.Por exemplo, dentro dos limites, você
pode aumentar a quantidade de memória ou armazenamento disponível para qualquer PC. Você
também pode usar periféricos avançados. No entanto, todos esses elementos se conectam por meio
de um barramento.
O fato de um PC se tornar mais capaz não muda os fatos de sua arquitetura essencial. Assim, o PC que
você usa hoje tem a mesma arquitetura dos dispositivos criados há muito tempo; eles são
simplesmente mais capazes. Além disso, o formato de um dispositivo também não afeta sua
arquitetura. Os computadores em seu carro contam com um sistema de barramento para
conectividade que depende diretamente da arquitetura Von Neumann. (Mesmo que o tipo de
barramento seja diferente, a arquitetura é a mesma.) Para que você não pense que nenhum
dispositivo permanece inalterado, observe o diagrama de blocos de um Blackberry emhttp://
mobilesaudi.blogspot.com/2011/10/all-blackberry-schematic-complete.
html.Também depende de uma configuração de Von Neumann. Consequentemente, quase todos os
dispositivos que você pode conceber hoje têm uma arquitetura semelhante, apesar de terem diferentes
fatores de forma, tipos de barramento e recursos essenciais.
permanece ocioso, reduzindo ainda mais sua capacidade de executar tarefas intensivas de IA.
58 PARTE 1Apresentando IA
Usando GPUs
Depois de criar uma configuração prototípica para executar as tarefas necessárias para simular o
pensamento humano sobre um determinado tópico, você pode precisar de hardware adicional para
fornecer poder de processamento suficiente para trabalhar com o conjunto de dados completo
exigido de um sistema de produção. Muitas maneiras estão disponíveis para fornecer esse poder de
processamento, mas uma maneira comum é usar unidades de processamento gráfico (GPUs) além do
processador central de uma máquina. As seções a seguir descrevem o domínio do problema que uma
GPU aborda, o que exatamente significa o termo GPU e por que uma GPU torna o processamento
mais rápido.
CONSIDERANDO A MÁQUINA DE
BOMBE DE ALAN TURING
A máquina Bombe de Alan Turing não era nenhuma forma de IA. Na verdade, nem é um computador de
verdade. Ele quebrou as mensagens criptográficas da Enigma, e é isso. No entanto, ele forneceu o que
pensar para Turing, o que acabou levando a um artigo intitulado “Computing Machinery and
Inteligência” (http://www.loebner.net/Prizef/TuringArticle.html)que ele
publicado na década de 1950 que descreveO jogo da imitação.No entanto, o próprio Bombe
foi baseado em uma máquina polonesa chamada Bomba.
Embora algumas fontes indiquem que Alan Turing trabalhou sozinho, o Bombe foi produzido com
a ajuda de muitas pessoas, principalmente Gordon Welchman. Turing também não surgiu do
vácuo, pronto para quebrar a criptografia alemã. Seu tempo em Princeton foi gasto com grandes
nomes como Albert Einstein e John von Neumann (que viria a inventar o conceito de software de
computador). Os artigos que Turing escreveu inspiraram esses outros cientistas a experimentar e
ver o que é possível.
Dentro do razoável, você pode superar alguns dos problemas que cercam o gargalo de
Von Neumann e produzir aumentos pequenos, mas perceptíveis, na velocidade do
aplicativo. Aqui estão as soluções mais comuns:
»Pré-busca:O problema com os caches é que eles se mostram úteis apenas quando
eles contêm os dados corretos. Infelizmente, as ocorrências de cache são baixas em
aplicativos que usam muitos dados e executam uma ampla variedade de tarefas. A
próxima etapa para tornar os processadores mais rápidos é adivinhar quais dados o
aplicativo exigirá em seguida e carregá-los no cache antes que o aplicativo os exija.
»Usando RAM especial:Você pode ser enterrado pela sopa de letrinhas RAM porque
existem mais tipos de RAM do que a maioria das pessoas imagina. Cada tipo de RAM pretende
resolver pelo menos parte do problema do gargalo de Von Neumann, e eles funcionam – dentro
dos limites. Na maioria dos casos, as melhorias giram em torno da ideia de obter dados da
memória e colocá-los no barramento mais rapidamente. Dois fatores principais (e muitos
menores) afetam a velocidade:velocidade da memória(quão rápido a memória move os dados) e
latência(quanto tempo leva para localizar um determinado pedaço de dados). Você pode ler mais
sobre a memória e os fatores que a afetam em
http://www.computermemoryupgrade.net/types-of-computer-
memorycommon-uses.html.
60 PARTE 1Apresentando IA
Como em muitas outras áreas da tecnologia, o hype pode se tornar um problema. Por exemplo,
multithreading,o ato de quebrar um aplicativo ou outro conjunto de instruções em unidades de
execução discretas que o processador pode manipular uma de cada vez, é frequentemente
apresentado como um meio de superar o gargalo de Von Neumann, mas na verdade não faz
nada além de adicionar sobrecarga (tornando o problema pior). Multithreading é uma resposta
para outro problema: tornar o aplicativo mais eficiente. Quando um aplicativo adiciona
problemas de latência ao gargalo Von Neumann, todo o sistema fica lento. O multithreading
garante que o processador não perca ainda mais tempo esperando pelo usuário ou pelo
aplicativo, mas tenha algo para fazer o tempo todo. A latência do aplicativo pode ocorrer com
qualquer arquitetura de processador, não apenas com a arquitetura Von Neumann. Mesmo
assim, tudo o que agiliza a operação geral de um aplicativo fica visível para o usuário e para o
sistema como um todo.
Definindo a GPU
A intenção original de uma unidade de processamento gráfico (GPU) era processar os dados da
imagem rapidamente e, em seguida, exibir a imagem resultante na tela. Durante a fase inicial da
evolução do PC, a CPU realizava todo o processamento, o que significava que os gráficos podiam
aparecer lentamente enquanto a CPU executava outras tarefas. Durante esse tempo, um PC
normalmente vinha equipado com umadaptador de exibição,que contém pouco ou nenhum poder de
processamento. Tudo o que um adaptador de vídeo faz é converter os dados do computador em uma
forma visual. Na verdade, usar apenas um processador provou ser quase inviável quando o PC passou
por telas somente de texto ou gráficos extremamente simples de 16 cores. No entanto, as GPUs
realmente não fizeram muitas incursões na computação até que as pessoas começaram a querer
saída 3-D. Nesse ponto, uma combinação de CPU e adaptador de vídeo simplesmente não daria conta
do recado.
Uma GPU move o processamento gráfico da placa-mãe para a placa de periféricos gráficos. A
CPU pode dizer à GPU para executar uma tarefa e, em seguida, a GPU determina o melhor
método para fazê-lo independentemente da CPU. Uma GPU tem uma memória separada e o
caminho de dados para seu barramento é imenso. Além disso, uma GPU pode acessar a
memória principal para obter dados necessários para executar uma tarefa e postar resultados
independentemente da CPU. Conseqüentemente, esta configuração possibilita exibições
gráficas modernas.
Assim como o chip 80860 descrito na seção anterior, as GPUs hoje se destacam na execução de
tarefas especializadas associadas ao processamento gráfico, incluindo o trabalho com vetores.
Todos esses núcleos executando tarefas em paralelo realmente aceleram os cálculos de IA.
Por outro lado, Bryan Catanzaro (equipe de pesquisa da NVidia) e Andrew Ng (Stanford)
conseguiram replicar o trabalho do Google usando um conjunto de 12 GPUs NVidia (consulte
https://blogs.nvidia.com/blog/2016/01/12/accelerating-ai-artificial-
inteligência-gpus/para detalhes). Depois que as pessoas entenderam que as GPUs poderiam
substituir uma série de sistemas de computador abastecidos com CPUs, elas poderiam começar a
avançar com uma variedade de projetos de IA. Em 2012, Alex Krizhevsky (Universidade de Toronto)
venceu a competição de reconhecimento de imagem de computador ImageNet usando GPUs. De fato,
vários pesquisadores já usaram GPUs com incrível sucesso (consulte o artigo
nohttps://adeshpande3.github.io/The-9-Deep-Learning-Papers-You-Need-To-Know-
About.htmlpara detalhes).
Aprendizagem profunda e IA são processos não Von Neumann, de acordo com muitos
especialistas, como Massimiliano Versace, CEO da Neurala Inc. (https://www.
neurala.com/).Como a tarefa que o algoritmo executa não corresponde ao hardware
subjacente, existem todos os tipos de ineficiências, hacks são necessários e obter um
resultado é muito mais difícil do que deveria ser. Portanto, projetar hardware que
corresponda ao software é bastante atraente. A Agência de Projetos de Pesquisa
Avançada de Defesa (DARPA) empreendeu um desses projetos na forma de Sistemas de
62 PARTE 1Apresentando IA
Eletrônica Escalável de Plástico Adaptativo Neuromórfico (SyNAPSE). A ideia por trás
dessa abordagem é duplicar a abordagem da natureza para resolver problemas
combinando memória e poder de processamento, em vez de manter os dois separados.
Eles realmente construíram o sistema (era imenso), e você pode ler mais sobre isso em
http://www.artificialbrains.com/darpa-synapse-program.
O projeto SyNAPSE avançou. A IBM construiu um sistema menor usando tecnologia moderna
que era incrivelmente rápida e eficiente em termos de energia (consultehttp://www.
research.ibm.com/cognitive-computing/neurosynaptic-chips.shtml).A única
problema é que ninguém está comprando. Assim como muitas pessoas argumentariam que o Betamax era
uma maneira melhor de armazenar dados do que o VHS, o VHS venceu em custo, facilidade de
uso e recursos atraentes (consultehttps://gizmodo.com/betamax-vs-vhshow-sony-lost-
the-original-home-video-1591900374).O mesmo vale
para a oferta SyNAPSE da IBM, TrueNorth. Tentar encontrar pessoas dispostas a pagar o
preço mais alto, programadores que possam desenvolver software usando a nova
arquitetura e produtos que realmente se beneficiem do chip tem sido difícil.
Consequentemente, uma combinação de CPUs e GPUs, mesmo com suas fraquezas
inerentes, continua vencendo.
A CPU ainda funciona bem para sistemas de negócios ou em aplicativos nos quais a necessidade de
flexibilidade geral na programação supera o poder de processamento puro. No entanto, as GPUs
agora são o padrão para vários tipos de necessidades de ciência de dados, aprendizado de máquina,
IA e aprendizado profundo. Claro, todo mundo está constantemente procurando a próxima grande
novidade no ambiente de desenvolvimento. Ambas as CPUs e GPUs são de nível de produção
»Field Programmable Gate Arrays (FPGAs):Tal como acontece com um ASIC, um fornecedor gera
ally fabrica um FPGA para uma finalidade específica. No entanto, ao contrário de um ASIC,
você pode programar um FPGA para alterar sua funcionalidade subjacente. Um exemplo de
solução FPGA é o Brainwave da Microsoft, que é usado para projetos de aprendizado
profundo (consultehttps://techcrunch.com/2017/08/22/microsoft-brainwave-aimsto-
accelerate-deep-learning-with-fpgas/para detalhes).
Os fornecedores também estão trabalhando em tipos de processamento totalmente novos, que podem ou
não funcionar conforme o esperado. Por exemplo, Graphcore está trabalhando em uma Unidade de
Processamento de Inteligência (IPU), conforme descrito emhttps://www.prnewswire.com/news-
releases/sequoia-backs-graphcore-as-the-future-of-artificialintelligence-
processors-300554316.html.Você tem que levar a notícia desses
novos processadores com um grão de sal, dado o hype que cercou a indústria no
passado. Quando você vê aplicativos reais de grandes empresas como Google e
Microsoft, pode começar a ter um pouco mais de certeza sobre o futuro da tecnologia
envolvida.
64 PARTE 1Apresentando IA
Os seres humanos normalmente têm cinco sentidos para interagir com o ambiente: visão, audição,
tato, paladar e audição. Curiosamente, os humanos ainda não entendem completamente suas
próprias capacidades, então não é tão surpreendente que os computadores demorem quando se
trata de sentir o ambiente da mesma forma que os humanos. Por exemplo, até recentemente, o sabor
compreendia apenas quatro elementos: sal, doce, amargo e azedo. No entanto, mais dois sabores
aparecem agora na lista: umami e gordura
(verhttps://fivethirtyeight.com/features/can-we-taste-fat/para detalhes).
Da mesma forma, algumas mulheres são tetracromatas (https://concettaantico.com/
tetracromacia/),que pode ver 100.000.000 de cores em vez dos 1.000.000 mais comuns
(somente as mulheres podem ser tetracromatas por causa dos requisitos
cromossômicos). Saber quantas mulheres têm essa capacidade ainda não é possível.
(Algumas fontes têm o número tão alto quanto 15 por cento; vejahttp://www.raredr.
com/contributor/ricki-lewis-phd/2016/12/a-good-mutation-seeing-theworld-with-
extra-conesehttp://sciencevibe.com/2016/12/11/the-womenthat-see-100-million-
colors-live-in-a-different-world/para detalhes.)
O uso de dados estáticos e dinâmicos filtrados permite que uma IA interaja com humanos de
maneiras específicas hoje. Por exemplo, considere Alexa (https://www.amazon.com/
Amazon-Echo-And-Alexa-Devices/b?node=9818047011),o dispositivo Amazon que
aparentemente ouve você e então diz algo de volta. Mesmo que a Alexa não entenda
realmente nada do que você diz, a aparência da comunicação é bastante viciante e
encoraja as pessoas a antropomorfizar esses dispositivos. Para executar sua tarefa, Alexa
requer acesso a um sensor especial: um microfone que permite ouvir. Na verdade, o
Alexa possui vários microfones para ajudá-lo a ouvir bem o suficiente para fornecer a
ilusão de compreensão. Infelizmente, por mais avançado que o Alexa seja, ele não pode
ver, sentir, tocar ou provar nada, o que o torna longe de ser humano, mesmo nas
menores formas.
Em alguns casos, os humanos realmente querem que sua IA tenha sentidos superiores ou diferentes.
Uma IA que detecta movimento à noite e reage a ele pode depender do infravermelho em vez da visão
normal. Na verdade, o uso de sentidos alternativos é um dos usos válidos para a IA hoje. A capacidade
de trabalhar em ambientes nos quais as pessoas não podem trabalhar é uma das razões pelas quais
alguns tipos de robôs se tornaram tão populares, mas trabalhar nesses ambientes geralmente requer
um conjunto de sensores não humanos. Conseqüentemente, o tópico de sensores na verdade se
enquadra em duas categorias (nenhuma das quais está totalmente definida): sensores de tipo
humano e sensores de ambiente alternativo.
Uma IA que é independente e nunca interage com o ambiente é inútil. Claro, essa
interação assume a forma de entradas e saídas. O tradicional
A interação com uma IA está ocorrendo cada vez mais de maneiras que os humanos
entendem melhor do que o contato direto com o computador. Por exemplo, a entrada
ocorre por meio de uma série de microfones quando você faz uma pergunta ao Alexa. A
IA transforma as palavras-chave na pergunta em tokens que ela pode entender. Esses
tokens então iniciam cálculos que formam uma saída. A IA tokeniza a saída em uma
forma humana compreensível: uma frase falada. Você então ouve a frase enquanto Alexa
fala com você por meio de um alto-falante. Resumindo, para fornecer funcionalidade útil,
a Alexa deve interagir com o ambiente de duas maneiras diferentes que atraem os
humanos, mas que a Alexa realmente não entende.
O ponto é que, à medida que a IA se torna mais capaz de realizar cálculos complexos em
pacotes menores com conjuntos de dados cada vez maiores, a capacidade de uma IA de
realizar tarefas interessantes aumenta. No entanto, as tarefas que a IA executa podem não ter
atualmente uma categoria humana. Você pode nunca interagir verdadeiramente com uma IA
que entenda sua fala, mas pode confiar em uma IA que o ajude a manter a vida ou pelo menos
torná-la mais habitável.
66 PARTE 1Apresentando IA
2
Considerando
os usos da IA
na sociedade
NESTA PARTE . . .
Capítulo5
Vendo usos de IA em
aplicativos de computador
Y
Você provavelmente já usou IA de alguma forma em muitos dos aplicativos de computador
nos quais confia para o seu trabalho. Por exemplo, falar com seu smartphone requer o uso de
uma IA de reconhecimento de fala. Da mesma forma, uma IA filtra todo o lixo eletrônico que
pode chegar à sua caixa de entrada. A primeira parte deste capítulo discute os tipos de aplicativos de
IA, muitos dos quais irão surpreendê-lo, e os campos que geralmente dependem da IA para executar
um número significativo de tarefas. Você também descobre uma fonte de limitações para a criação de
aplicativos baseados em IA, o que ajuda a entender por que os robôs sencientes podem nunca existir -
ou não com a tecnologia disponível atualmente, pelo menos.
A terceira parte principal do capítulo discute possíveis erros de IA. Ocorre um erro sempre que
o resultado é diferente do esperado. O resultado pode ser bem-sucedido, mas pode
permanecer inesperado. É claro que também ocorrem erros absolutos; um AI pode não
fornecer um resultado bem-sucedido. Talvez o resultado seja contrário ao objetivo original
(possivelmente causando danos). Se você tem a ideia de que os aplicativos de IA fornecem
resultados cinza, em vez de preto ou branco, você está no caminho certo para entender como a
IA modifica os aplicativos de computador típicos, que, de fato, fornecem um resultado
absolutamente correto ou absolutamente incorreto. .
»criatividade artificial
»Visão computacional, realidade virtual e processamento de imagem
»Reconhecimento de caligrafia
»Processamento de linguagem natural, tradução e chatterbots
»Controle não linear e robótica
»Reconhecimento óptico de caracteres
»Reconhecimento de fala
»vida artificial
»Raciocínio automatizado
»Automação
»Computação biologicamente inspirada
»Mineração de conceito
»Mineração de dados
»web semântica
No segundo teste, um humano que não fala chinês recebe três itens que imitam o que o
computador faz. O primeiro é um script que contém um grande número de caracteres
chineses, o segundo é uma história em chinês e o terceiro é um conjunto de regras para
correlacionar o primeiro item ao segundo. Alguém envia um conjunto de perguntas,
escritas em chinês, que o humano entende usando o conjunto de regras para encontrar o
local na história que contém a resposta com base na interpretação dos caracteres
chineses. A resposta é o conjunto de caracteres chineses que se correlacionam com a
pergunta com base nas regras. O humano fica tão bom nessa tarefa que ninguém
consegue perceber a falta de compreensão da língua chinesa.
O objetivo dos dois testes é demonstrar que a capacidade de usar regras formais para produzir
um resultado (sintaxe) não é o mesmo que realmente entender o que alguém está fazendo
(semântica). Searle postulou que a sintaxe não é suficiente para a semântica, mas é isso que
algumas pessoas que implementam uma IA estão tentando dizer quando se trata de criar
vários mecanismos baseados em regras, como o Script Applier
Mecanismo (SAM); verhttps://eric.ed.gov/?id=ED161024para detalhes.
A questão subjacente refere-se a ter uma IA forte, que realmente entende o que está
tentando fazer, e uma IA fraca, que simplesmente segue as regras. Toda IA hoje é IA
fraca; na verdade não entende nada. O que você vê é uma programação inteligente que
simula o pensamento usando regras (como aquelas implícitas em algoritmos). Claro,
muita controvérsia surge sobre a ideia de que não importa o quão complexas as
máquinas se tornem, elas não desenvolverão cérebros, o que significa que elas nunca
entenderão. A afirmação de Searle é que a IA permanecerá fraca. Você pode ver uma
discussão sobre este tópico emhttp://www.iep.utm.edu/chineser/.
Mesmo na área de sugestões, os humanos podem começar a pensar que a IA está pensando,
mas não está. A IA está executando uma forma avançada de correspondência de padrões, bem
como análise para determinar a probabilidade da necessidade de uma entrada específica. A
seção “Considerando o argumento da sala chinesa”, anteriormente neste capítulo, discute a
diferença entre IA fraca, o tipo encontrado em todos os aplicativos hoje, e IA forte, algo que os
aplicativos podem eventualmente alcançar.
Usar uma IA também significa que os humanos agora podem exercer outros tipos de entrada
inteligente. O exemplo da voz é quase usado em demasia, mas continua sendo um dos métodos mais
comuns de entrada inteligente. No entanto, mesmo que uma IA careça de toda a gama de sentidos,
conforme descrito no Capítulo 4, ela pode fornecer uma ampla variedade de entradas inteligentes
não-verbais. Uma escolha óbvia é visual, como reconhecer o rosto de seu dono ou uma ameaça com
base na expressão facial. No entanto, a entrada pode incluir um monitor, possivelmente verificando os
sinais vitais do usuário em busca de possíveis problemas. Na verdade, uma IA poderia usar um
número enorme de entradas inteligentes, a maioria das quais ainda nem foi inventada.
Claro, toda essa discussão sobre leis e ética pode ser bastante confusa e difícil de definir. Um
exemplo simples de comportamento da FAI seria que a FAI se recusaria a divulgar informações
pessoais do usuário, a menos que o destinatário precisasse saber. Na verdade, um FAI poderia
ir ainda mais longe, combinando padrões de entrada humana e localizando informações
pessoais em potencial, notificando o usuário sobre o potencial de dano antes de enviar as
informações para qualquer lugar. O ponto é que uma IA pode mudar significativamente a
forma como os humanos visualizam os aplicativos e interagem com eles.
Levando adiante todo o cenário de correção, o carro na frente do carro que contém a IA
faz uma parada repentina por causa de um cervo na estrada. O motorista do carro atual
não cometeu nenhum tipo de erro. No entanto, a IA pode reagir mais rápido do que o
motorista e age para parar o carro o mais rápido e com segurança possível para abordar
o carro agora parado à sua frente.
Fazendo sugestões
Uma sugestão é diferente de um comando. Mesmo que alguns humanos pareçam não
entender nada, uma sugestão é simplesmente uma ideia apresentada como uma possível
solução para um problema. Fazer uma sugestão implica que outras soluções possam
existir e que aceitar uma sugestão não significa implementá-la automaticamente. Na
verdade, a sugestão é apenas uma ideia; pode até não funcionar. É claro que, em um
mundo perfeito, todas as sugestões seriam boas sugestões - pelo menos soluções
possíveis para uma saída correta, o que raramente é o caso no mundo real. As seções a
seguir descrevem a natureza das sugestões conforme elas se aplicam a uma IA.
Os grupos podem incluir conexões etéreas que são, na melhor das hipóteses, temporárias. Por
exemplo, todas as pessoas que voaram no voo 1982 saindo de Houston em um determinado dia
poderiam formar um grupo. Novamente, não existe nenhuma conexão entre essas pessoas, exceto
que elas apareceram em um voo específico. No entanto, ao conhecer essas informações, uma IA
poderia realizar uma filtragem adicional para localizar pessoas dentro do voo que gostam de
mistérios. O ponto é que uma IA pode fornecer boas sugestões com base na afiliação de grupo,
mesmo quando o grupo é difícil (se não impossível) de identificar do ponto de vista humano.
Além de erros lógicos ou baseados em regras em IAs, as sugestões podem ser corrompidas por
problemas de dados. Por exemplo, um GPS pode fazer uma sugestão com base nos melhores dados
possíveis para uma determinada viagem. No entanto, a construção de estradas pode fazer
Quando uma IA consegue superar os problemas de lógica, regra e dados, às vezes ainda
faz sugestões ruins porque não entende a correlação entre certos conjuntos de dados da
mesma forma que um ser humano. Por exemplo, a IA pode não saber sugerir tinta depois
que um humano compra uma combinação de tubo e drywall ao fazer um reparo no
encanamento. A necessidade de pintar o drywall e a área ao redor após o reparo é óbvia
para um ser humano, porque um ser humano tem um senso de estética que falta à IA. O
humano faz uma correlação entre vários produtos que não é óbvia para a IA.
Um erro absoluto ocorre quando o resultado de um processo, dado entradas específicas, não está
correto de nenhuma forma. A resposta não fornece uma resposta adequada a uma consulta. Não é
difícil encontrar exemplos de erros baseados em IA. Por exemplo, um artigo recente da BBC News
descreve como uma única diferença de pixel em uma imagem engana uma IA específica (consulte
o artigo emhttp://www.bbc.com/news/technology-41845878).Você pode ler
mais sobre o impacto dos ataques adversários na IA emhttps://blog.openai.com/
pesquisa-exemplo-adversarial/.O artigo do Kasperskey Lab Daily emhttps://
www.kaspersky.com/blog/ai-fails/18318/fornece ocorrências adicionais de
situações em que um AI falhou em fornecer a resposta correta. O ponto é que a IA ainda tem
uma alta taxa de erros em algumas circunstâncias, e os desenvolvedores que trabalham com a
IA geralmente não sabem ao certo por que os erros ocorrem.
A valiosa pepita de verdade a ser extraída desta seção não é que a IA não seja confiável ou inutilizável.
Na verdade, quando combinada com um ser humano experiente, a IA pode tornar sua contraparte
humana rápida e eficiente. A IA pode permitir que os humanos reduzam erros comuns ou repetitivos.
Em alguns casos, os erros de IA podem até proporcionar um pouco de humor durante o dia. No
entanto, a IA não pensa e não pode substituir os humanos em muitas situações dinâmicas hoje. A IA
funciona melhor quando um humano analisa as decisões ou o ambiente é tão estático que os bons
resultados são previsivelmente altos (bem, desde que um humano não opte por confundir a IA).
usando IA
Capítulo6
Automação Comum
Processos
C
o capítulo 5 considera o uso de IA em umaplicativo,que é uma situação em que um
humano interage com a IA de alguma forma significativa, mesmo que o humano não
saiba da presença da IA. O objetivo é ajudar os humanos a fazer algo mais rápido, mais
fácil, mais eficiente ou a atender a alguma outra necessidade. Aprocesso que inclui uma IA é
diferente porque a IA agora está trabalhando para ajudar um humano ou realizar alguma outra
tarefa sem intervenção direta. A primeira seção deste capítulo aborda como os processos
ajudam os humanos. Dado que o tédio é possivelmente o pior cenário humano (basta pensar
em todas as coisas negativas que acontecem quando os humanos estão entediados), este
capítulo analisa o processo de IA para humanos a partir de uma perspectiva de tédio.
O ponto deste capítulo é que a IA funciona bem em processos, especialmente naqueles processos
durante os quais os humanos tendem a ficar entediados, levando-os a cometer um erro quando a IA
provavelmente não o faria. Obviamente, uma IA não pode eliminar todas as fontes de perda de
eficiência, desinteresse e problemas de segurança. Por um lado, os humanos podem optar por ignorar
a ajuda da IA, mas a natureza das limitações é muito mais profunda do que isso. Conforme discutido
nos capítulos anteriores (principalmente no Capítulo 5), uma IA não entende; ele não pode fornecer
soluções criativas ou inovadoras para os problemas, então alguns problemas não podem ser
resolvidos por uma IA, não importa quanto esforço alguém despenda para criá-los.
O problema não é necessariamente mudar de emprego, então, mas tornar o trabalho mais
interessante como um meio de evitar o tédio. Uma IA pode efetivamente ajudar nesse processo
removendo a repetição das tarefas. No entanto, exemplos como o Alexa da Amazon e o Home
do Google fornecem outras alternativas. O sentimento de solidão que pode permear a casa, o
local de trabalho, o carro e outros locais é um forte criador de tédio. Quando os humanos
começam a se sentir sozinhos, a depressão se instala e o tédio geralmente está a apenas um
passo de distância. Criação de aplicativos que usam a interface Alexa (consulte
https://developer.amazon.com/)ou Ações na API do Google (consultehttps://
developers.google.com/actions/)simular a interação humana do tipo apropriado pode melhorar a
experiência no local de trabalho. Mais importante, o desenvolvimento de interfaces inteligentes desse
tipo pode ajudar os humanos a realizar uma variedade de tarefas mundanas rapidamente, como
pesquisar informações e interagir com dispositivos inteligentes, não apenas
interruptores de luz (verhttps://www.imore.com/how-control-your-lights-amazonecho
ehttps://store.google.com/product/google_homepara detalhes).
A questão é que os humanos provavelmente fornecerão as ideias mais interessantes sobre como criar
uma IA que atenda especificamente às necessidades dessa pessoa. Na maioria dos casos, ideias sérias
funcionarão bem para outros usuários também. Por exemplo, automatizar tíquetes de problemas é
algo que pode funcionar em vários setores diferentes. Se alguém viesse com uma interface genérica,
com um back-end programável para gerar os tíquetes de problemas personalizados necessários, a IA
poderia economizar muito tempo dos usuários e garantir eficiências futuras, garantindo que os
tíquetes de problemas registrem consistentemente as informações necessárias.
O acesso a recursos de todos os tipos ajuda a reduzir o tédio ao permitir que os humanos criem
sem a necessidade mundana de adquirir os materiais necessários. Aqui estão algumas
maneiras pelas quais uma IA pode facilitar o acesso aos recursos:
Uma IA também não pode motivá-lo. Pense no que acontece quando um amigo aparece para
ajudar a motivá-lo (ou você motiva o amigo). O amigo, na verdade, conta com uma combinação
de conhecimento intrapessoal (empatia ao considerar como ela se sentiria em sua situação) e
conhecimento interpessoal (projeção de ideias criativas sobre como obter uma resposta
emocional positiva de você). Uma IA não terá nenhum do primeiro tipo de conhecimento e
apenas quantidades extremamente limitadas do segundo tipo de conhecimento, conforme
descrito no Capítulo 1. Conseqüentemente, uma IA não pode reduzir seu tédio por meio de
técnicas motivacionais.
É provável que qualquer ambiente industrial tenha riscos de segurança, não importa quanto tempo,
esforço e dinheiro sejam investidos no problema. Você pode facilmente encontrar artigos como:
http://www.safetyandhealthmagazine.com/articles/14054-common-
riscos de segurança no local de trabalho,que descreve sete riscos de segurança comuns
encontrados em ambientes industriais. Embora os humanos causem muitos desses problemas
e o tédio os torne piores, o ambiente real em que os humanos estão trabalhando causa muitos
problemas. As seções a seguir descrevem como a automação pode ajudar as pessoas a viverem
vidas melhores e mais longas.
O que não existe há muito tempo é uma IA que pode realmente ajudar os humanos no
processo de automação. Em muitos casos hoje, um operador humano começa descrevendo
como realizar a tarefa, criando umtrabalho,e, em seguida, transfere o trabalho para um
4.A IA determina as opções, usa-as para definir uma série de ações e, em seguida,
entrega a lista de ações a um humano para aceitação ou rejeição de ações
individuais antes da implementação.
5.A IA determina as opções, define uma série de ações, cria um trabalho e depois
pede a aprovação humana antes de enviar o trabalho para o computador.
6.A IA cria automaticamente o trabalho e o envia para a fila de trabalhos do computador, com
o operador humano atuando como intermediário caso o trabalho selecionado exija
encerramento antes da implementação real.
8.A IA cria e implementa o trabalho, dizendo ao humano o que ele fez somente quando o
humano pergunta.
9.A IA cria e implementa o trabalho sem fornecer nenhum feedback, a menos que um
humano precise intervir, como quando ocorre um erro ou o resultado não é o
esperado.
10.A IA inicia a necessidade do trabalho, em vez de esperar que o humano diga para criar o
trabalho. A IA fornece feedback apenas quando um ser humano deve intervir, como
quando ocorre um erro. A IA pode fornecer um nível de correção de erros e gerenciar
resultados inesperados por conta própria.
Os robôs realizam grande parte do trabalho real em um ambiente industrial, mas você
também precisa de sensores para avaliar riscos potenciais, como tempestades. No
entanto, a coordenação está se tornando cada vez mais importante para garantir que as
operações permaneçam eficientes. Por exemplo, garantir que os caminhões com
matérias-primas cheguem na hora certa, enquanto outros caminhões que transportam
produtos acabados estejam disponíveis quando necessário, são tarefas essenciais para
manter os pisos dos armazéns funcionando com eficiência. A IA precisa saber sobre o
status de manutenção de todos os equipamentos para garantir que o equipamento
receba o melhor cuidado possível (para melhorar a confiabilidade) e os momentos em
que é menos necessário (para melhorar a eficiência). A IA também precisaria considerar
questões como custo de recursos.
realizarem.
»Sugira rotações de trabalho (seja no local de trabalho, no carro ou mesmo em casa) para
mantenha as tarefas interessantes
»Aumente os recursos de detecção humana para que possíveis problemas de segurança se tornem
mais óbvio
»Assuma tarefas repetitivas para que os humanos tenham menos probabilidade de se cansar
e participar dos aspectos interessantes de qualquer trabalho
Situações imprevisíveis não são o único problema que uma IA enfrenta. Mesmo que alguém
encontrasse todas as maneiras possíveis pelas quais um humano poderia se tornar inseguro, o poder
de processamento necessário para detectar o evento e determinar um curso de ação seria
astronômico. A IA funcionaria tão lentamente que sua resposta sempre ocorreria tarde demais para
fazer qualquer diferença. Consequentemente, os desenvolvedores de equipamentos de segurança
que realmente requerem uma IA para executar o nível de segurança exigido precisam lidar com
probabilidades e, em seguida, proteger-se contra as situações com maior probabilidade de acontecer.
Capítulo7
Usando a IA para atender às
necessidades médicas
M
medicina é complicada. Há uma razão pela qual pode levar 15 ou mais anos para
formar um médico, dependendo da especialidade (verhttp://work.chron.com/
long-torne-doctor-us-7921.htmlpara detalhes). Na hora que a escola
sistema embala um médico com informações suficientes para quase explodir, a maioria
das outras pessoas já está no mercado de trabalho há 11 anos (dado que a maioria vai
parar com um diploma de associado ou bacharel). Enquanto isso, a criação de novas
tecnologias, abordagens e assim por diante, tudo conspira para tornar a tarefa ainda
mais complexa. Em algum momento, torna-se impossível para qualquer pessoa se tornar
proficiente mesmo em uma especialidade restrita. Claro, esta é a principal razão pela qual
um ser humano insubstituível requer ajuda consistente, lógica e imparcial na forma de
uma IA. O processo começa ajudando o médico a monitorar os pacientes (conforme
descrito na primeira seção deste capítulo) de maneiras que os humanos simplesmente
achariam impossíveis porque o número de verificações é alto, a necessidade de realizá-
las em uma determinada ordem e de uma maneira específica é crítico,
Felizmente, as pessoas têm mais opções hoje do que nunca para realizar muitas tarefas
médicas por conta própria. Por exemplo, o uso de jogos permite que um paciente realize
algumas tarefas relacionadas à terapia sozinho, mas obtenha orientação de um aplicativo que
garante que a pessoa execute a tarefa da maneira mais adequada para se tornar saudável
novamente. Próteses aprimoradas e outras ajudas médicas também permitem que as pessoas
se tornem mais independentes da assistência profissional. A segunda seção deste capítulo
descreve como a IA pode ajudar as pessoas com suas próprias necessidades médicas.
É claro que algumas intervenções exigem que o paciente se submeta a uma cirurgia ou outros
procedimentos (conforme descrito na quarta seção deste capítulo). Às vezes, uma solução
robótica pode executar a tarefa melhor do que o médico. Em alguns casos, uma solução
assistida por robô torna o médico mais eficiente e ajuda a concentrar a atenção do médico em
áreas que apenas um ser humano pode abordar. O uso de vários tipos de tecnologia também
torna o diagnóstico mais fácil, rápido e preciso. Por exemplo, usar uma IA pode ajudar um
médico a localizar o início do câncer muito mais cedo do que o médico poderia realizar a tarefa
sozinho.
Um profissional médico nem sempre é capaz de dizer o que está acontecendo com a saúde de
um paciente simplesmente ouvindo seu coração, verificando os sinais vitais ou realizando um
exame de sangue. O corpo nem sempre envia sinais úteis que permitem que um profissional
médico aprenda alguma coisa. Além disso, algumas funções do corpo, como o açúcar no
sangue, mudam com o tempo, tornando necessário um monitoramento constante. Ir ao
consultório médico toda vez que você precisar verificar um desses sinais vitais seria demorado
e possivelmente não tão útil. Métodos mais antigos de determinação de algumas
características corporais exigiam intervenção manual e externa por parte do paciente - um
processo propenso a erros na melhor das hipóteses. Por esses motivos, e muitos mais, uma IA
pode ajudar a monitorar as estatísticas de um paciente de maneira eficiente, menos propensa a
erros e mais consistente.
Lembre-se, se um dispositivo de monitoramento do tipo relógio for muito grande, o Motiv (https://
mymotiv.com/)produz um anel que monitora aproximadamente o mesmo número de coisas que o
Moov faz, mas em um pacote menor. Este anel ainda rastreia como você dorme para ajudá-lo a ter
uma boa noite de sono. Anéis tendem a vir com uma variedade de profissionais
e contras. O artigo emhttps://www.wareable.com/smart-jewellery/best-
anéis inteligentes-1340fala mais sobre essas questões. Curiosamente, muitas das fotos
no site não se parecem em nada com um monitor de fitness, então você pode ter moda e
saúde em um único pacote.
Claro, se seu único objetivo é monitorar sua frequência cardíaca, você pode obter dispositivos como
como Apple Watch (https://support.apple.com/en-us/HT204666)que também
fornecer algum nível de análise usando uma IA. Todos esses dispositivos interagem com seu
smartphone, para que você possa vincular os dados a outros aplicativos ou enviá-los ao seu
médico conforme necessário.
No entanto, imagine sua bomba de insulina ou desfibrilador implantado funcionando mal como
resultado de hackers e considere os danos que isso pode causar. A Federal Drug Administration
(FDA) finalmente publicou orientações sobre segurança de dispositivos médicos,
como descrito no artigo emhttp://www.securityweek.com/fda-releasesguidance-
medical-device-cybersecurity,mas essas diretrizes não são aparentemente
aplicado. Na verdade, este artigo continua dizendo que os fornecedores estão buscando ativamente maneiras de evitar a
A IA não é responsável pela falta de segurança que esses dispositivos possuem, mas a IA pode ser
responsabilizada caso ocorra uma violação. A questão é que você precisa ver todos os aspectos do uso da IA,
especialmente quando se trata de dispositivos que afetam diretamente os seres humanos, como dispositivos
médicos implantáveis.
Alguns dispositivos são realmente críticos, como o Wearable Defibrillator Vest (WDV), que
detecta continuamente a condição do seu coração e fornece um choque caso seu coração
parar de funcionar corretamente (consultehttps://www.healthafter50.com/heart-
health/article/wearable-defibrillator-vest-pros-and-conspara detalhes). Este curto-
A solução de longo prazo pode ajudar o médico a decidir se você precisa da versão implantada do
mesmo dispositivo. Existem prós e contras em usar um, mas, novamente, é difícil atribuir valor a ter
um choque disponível quando necessário para salvar uma vida. O maior valor deste dispositivo é o
monitoramento que ele fornece. Algumas pessoas não precisam realmente de um dispositivo
implantável, portanto, o monitoramento é essencial para evitar cirurgias desnecessárias.
Os dispositivos médicos atuais funcionam muito bem, mas não são portáteis. O objetivo de criar
aplicativos habilitados para IA e dispositivos especializados é obter dados muito necessários quando
um médico realmente precisa deles, em vez de ter que esperar por esses dados. Mesmo que você não
compre uma escova de dentes para monitorar sua técnica ou um ECG para monitorar seu coração, o
fato de esses dispositivos serem pequenos, capazes e fáceis de usar significa que você ainda pode se
beneficiar deles em algum momento.
suposição é que o atendimento não é apenas o melhor disponível, mas também justo. Um lugar onde uma IA
pode ajudar na área médica é garantir que as habilidades técnicas permaneçam altas e que não exista nenhum
Os seres humanos sempre exibirão preconceito porque possuem inteligência intrapessoal (conforme
descrito no Capítulo 1). Mesmo a pessoa mais gentil e altruísta exibirá alguma forma de preconceito —
geralmente inconscientemente —, criando uma condição na qual o cuidador vê uma coisa e o paciente vê
outra (consulte a seção “Considerando as cinco inverdades nos dados” no Capítulo 2). No entanto, as
pessoas que estão sendo atendidas quase certamente perceberão, e sua doença provavelmente
aumentará o desprezo não intencional. Usar uma IA para garantir imparcialidade ao lidar com os
problemas do paciente é uma maneira de evitar esse problema. A IA também pode ajudar os cuidadores
a descobrir mentiras (não intencionais ou não) por parte dos pacientes ao relatar seus sintomas,
melhorando assim o cuidado.
A área médica pode ser problemática às vezes porque a habilidade técnica geralmente não é
suficiente. As pessoas freqüentemente reclamam da falta de educação por parte da equipe
médica. As mesmas pessoas que desejam tratamento justo também desejam, de alguma forma,
empatia de seus cuidadores (tornando o cuidado injusto porque agora é tendencioso). A empatia
difere da simpatia no contexto. pessoas exibemempatiaquando são capazes de sentir o mesmo
que o paciente e construir um quadro de referência com o paciente. Dois exercícios na seção
“Considerando as soluções baseadas em software” deste capítulo ajudam você a entender como
alguém pode construir um quadro de referência para criar empatia. Uma IA nunca poderia
construir a empatia necessária porque uma IA carece da percepção sensorial e compreensão
necessárias para criar um quadro de referência e da inteligência intrapessoal necessária para
utilizar tal quadro de referência.
Por mais interessante que seja o uso de exoesqueletos para tornar as pessoas capazes ainda mais incríveis, o
que eles podem permitir que as pessoas façam o que não podem fazer agora é absolutamente incrível.
Embora este livro seja sobre acabar com o hype em torno da IA e apresentar alguns usos
positivos para ela, o fato é que o indivíduo inteligente pelo menos considera o lado negro de
qualquer tecnologia. Essa estratégia se torna perigosa quando as pessoas dão um alarme sem
nenhum fato para apoiar uma determinada afirmação. Sim, os ladrões podem enlouquecer com
exoesqueletos, o que deve fornecer incentivo para protegê-los adequadamente, mas também não
aconteceu ainda. Considerações éticas de usos potenciais, tanto positivos quanto negativos,
sempre acompanham a criação de uma tecnologia como a IA.
Ao longo do livro, você encontra várias considerações éticas e morais no uso positivo da IA para
ajudar a sociedade. É definitivamente importante manter a tecnologia segura, mas você também
deve ter em mente que evitar a tecnologia por causa de seu potencial negativo é realmente
contraproducente.
Ao mesmo tempo, perder um membro ou ter outra necessidade especial significava anos de
consultas médicas, capacidade reduzida e uma vida mais curta e menos feliz. No entanto,
melhores próteses e outros dispositivos, muitos deles habilitados para IA, tornaram esse
cenário uma coisa do passado para muitas pessoas. Por exemplo, veja o casal dançando no
https://www.youtube.com/watch?v=AJOQj4NGJXA.A mulher tem uma prótese
perna. Hoje em dia, algumas pessoas podem correr uma maratona ou escalar rochas, mesmo que
tenham perdido as pernas originais.
As pessoas que você vê online que são especialmente adeptas de ter uma vida incrível, apesar
de suas necessidades especiais, geralmente são pessoas especiais. Eles trabalharam muito para
chegar onde estão agora. O uso de um dispositivo habilitado para IA pode abrir a porta, mas,
para entrar, você deve estar disposto a fazer o que for necessário para fazer o dispositivo
funcionar, o que geralmente requer horas e horas de terapia. Este capítulo não pretende
diminuir a incrível quantidade de trabalho que essas pessoas incríveis colocaram para tornar
suas vidas melhores. Em vez disso, destaca as tecnologias que ajudam a tornar suas conquistas
possíveis. Se você realmente quer ver algo incrível, confira a bailarina em
http://www.dailymail.co.uk/news/article-3653215/Schoolgirl-legamputated-
knee-foot-attached-stump-suffering-rare-bone-cancerdefies-odds-
competitive-ballet-dancer.html.O artigo deixa claro o
quantidade de trabalho necessária para fazer essas várias tecnologias funcionarem.
Alguns dos primeiros sistemas de olhar fixo conectados a um braço robótico por meio do computador.
O braço robótico pode realizar ações extremamente simples, mas importantes, como ajudar os
usuários a tomar uma bebida ou coçar o nariz. Os sistemas modernos realmente ajudam a conectar o
cérebro de um usuário diretamente ao braço robótico, tornando possível realizar
tarefas como comer sem ajuda (verhttps://www.engadget.com/2017/03/29/paralyzed-
man-first-to-move-his-arm-by-thinking-about-it/).
Um dilema moral que talvez tenhamos que considerar em algum momento no futuro
(felizmente não hoje) é quando as próteses realmente permitem que seus usuários superem
substancialmente a capacidade humana nativa. Por exemplo, no filme Eon Flux, Sithandra
tem as mãos no lugar dos pés (https://www.awn.com/vfxworld/aeon-flux-live-action-
mundo animado).As mãos são essencialmente uma espécie de prótese enxertada em
alguém que costumava ter pés normais. Surge a questão de saber se esse tipo de
implementação protética é válido, útil ou mesmo desejável. Em algum momento, um
grupo de pessoas precisará se sentar e determinar onde o uso de próteses deve terminar
para manter os humanos como humanos (supondo que decidamos permanecer
humanos e não evoluir para uma próxima fase). Obviamente, você não verá ninguém
com as mãos no lugar dos pés hoje.
Por mais impressionantes que sejam os recursos de detecção e velocidade da IA nessa área, o que
realmente faz a diferença é a capacidade de combinar IA de várias maneiras para realizar compilações
de dados da Internet das Coisas (IoT). Quando o AI detecta uma condição em um determinado
paciente, ele pode verificar automaticamente os registros do paciente e exibir as informações
relevantes na tela com os exames diagnosticados, conforme mostrado no artigo em
https://www.itnonline.com/article/how-artificial-intelligence-will-
mudança de imagem médica.Agora o médico tem todas as informações pertinentes
para um paciente antes de fazer um diagnóstico e considerar um caminho específico.
Preparar-se para a cirurgia também significa analisar todos aqueles exames que os médicos
insistem em fazer. A velocidade é uma vantagem que a IA tem sobre um radiologista. Produtos
como Enlitic (https://www.enlitic.com/),uma tecnologia de aprendizado profundo, pode
analisar varreduras radiológicas em milissegundos - até 10.000 vezes mais rápido que um
radiologista. Além disso, o sistema é 50% melhor na classificação de tumores e tem uma taxa
de falso-negativo menor (0% versus 7%) do que os humanos. Outro produto desta categoria,
Arterys (https://arterys.com/),pode realizar uma varredura cardíaca em 6 a 10 minutos, em vez
da hora normal. Os pacientes também não precisam perder tempo prendendo a respiração.
Surpreendentemente, este sistema obtém várias dimensões de dados: anatomia do coração 3-
D, taxa de fluxo sanguíneo e direção do fluxo sanguíneo, neste curto espaço de tempo. Você
pode ver um vídeo sobre Arterys emhttps://www.youtube.com/
watch?v=IcooATgPYXc.
Ajudando um cirurgião
A maior parte da ajuda robótica para cirurgiões hoje auxilia, em vez de substituir, o cirurgião. O
primeiro robô cirurgião, o sistema PUMA, surgiu em 1986. Ele realizava uma biópsia
neurocirúrgica extremamente delicada, que é um tipo de cirurgia não laparoscópica. A cirurgia
laparoscópica é minimamente invasiva, com um ou mais pequenos orifícios que servem para
fornecer acesso a um órgão, como uma vesícula biliar, para remoção ou reparo. Os primeiros
robôs não eram suficientemente hábeis para realizar esta tarefa.
Freqüentemente, as pessoas percebem que nenhuma das incríveis tecnologias utilizadas pelos
profissionais médicos hoje realmente chega aos países do terceiro mundo. Na verdade, algumas
dessas tecnologias, como os produtos da Bay Labs (https://baylabs.io/),destinam-se
especificamente a países do terceiro mundo. Os médicos usaram a tecnologia resultante na África
para identificar sinais de doença cardíaca reumática (RHD) em crianças quenianas. Durante uma
visita em setembro de 2016, os médicos usaram o equipamento do Bay Labs para escanear 1.200
crianças em quatro dias e identificaram 48 crianças com CR ou doença cardíaca congênita. Sem IA,
o equipamento não existiria porque nunca seria pequeno ou fácil de operar para uso nesses
ambientes.
»cirurgias urológicas
»Cirurgias laparoscópicas gerais
»Cirurgias toracoscópicas não cardiovasculares gerais
»Procedimentos de cardiotomia assistida por toracoscopicamente
O ponto por trás da inclusão de todo esse jargão médico é que o Sistema Cirúrgico da
Vinci pode realizar muitas tarefas sem envolver um cirurgião diretamente. Em algum
momento, os cirurgiões robôs se tornarão mais autônomos, mantendo os humanos
ainda mais distantes do paciente durante a cirurgia. No futuro, ninguém entrará na sala
limpa com o paciente, reduzindo assim as chances de infecção a quase zero. Você pode
ler mais sobre o Sistema Cirúrgico da Vinci emhttp://www.
davincisurgery.com/da-vinci-surgery/da-vinci-surgical-system/.
Os médicos não interagem necessariamente com os registros da mesma forma que todo
mundo faz. O uso de produtos como WatsonPaths da IBM (http://www.
research.ibm.com/cognitive-computing/watson/watsonpaths.shtml)ajuda
os médicos interagem com dados de pacientes de todos os tipos de novas maneiras para tomar melhores
decisões de diagnóstico sobre a saúde do paciente. Você pode ver um vídeo sobre como este produto
trabalha emhttps://www.youtube.com/watch?v=07XPEqkHJ6U.
Prevendo o futuro
Alguns softwares preditivos realmente incríveis baseados em registros médicos incluem
CareSkore (https://www.careskore.com/),que na verdade usa algoritmos para
determinar a probabilidade de um paciente exigir readmissão no hospital após uma
internação. Ao realizar essa tarefa, a equipe do hospital pode revisar os motivos de uma
possível readmissão e resolvê-los antes que o paciente deixe o hospital, tornando a
readmissão menos provável. Juntamente com esta estratégia, a Zephyr Health (https://
zephyrhealth.com/)ajuda os médicos a avaliar várias terapias e escolher aquelas com
maior probabilidade de resultar em um resultado positivo - novamente reduzindo o risco
de um paciente precisar de readmissão no hospital. O vídeo emhttps://www.youtube.
com/watch?v=9y930hioWjwdiz-lhe mais sobre Zephyr Health.
Em alguns aspectos, sua genética forma um mapa do que acontecerá com você no
futuro. Conseqüentemente, conhecer sua genética pode aumentar sua compreensão de
seus pontos fortes e fracos, ajudando você a viver uma vida melhor. Genômica Profunda (
https://www.deepgenomics.com/)é descobrir como as mutações em sua genética afetam
você como pessoa. As mutações nem sempre produzem um resultado negativo; algumas
mutações realmente tornam as pessoas melhores, portanto, saber sobre mutações
também pode ser uma experiência positiva. Confira o vídeo emhttps://www.youtube.
com/watch?v=hVibPJyf-xgpara mais detalhes.
Os médicos precisam de muitos dados para tomar boas decisões. No entanto, com os dados
espalhados por todo o lugar, os médicos que não têm a capacidade de analisar esses dados
díspares rapidamente geralmente tomam decisões imperfeitas. Para tornar os procedimentos
mais seguros, o médico precisa não apenas de acesso aos dados, mas também de alguns meios
de organizá-los e analisá-los de maneira que reflita a especialidade do médico. Um desses
produtos é o Oncora Medical (https://oncoramedical.com/),que coleta e organiza registros
médicos para oncologistas de radiação. Como resultado, esses médicos podem aplicar a
quantidade certa de radiação nos locais certos para obter um resultado melhor com menor
potencial de efeitos colaterais imprevistos.
Claro, melhor ainda seria a empresa farmacêutica ter uma ideia melhor de quais drogas
provavelmente funcionariam e quais não funcionariam antes de investir algum dinheiro em pesquisa.
átomo a átomo (http://www.atomwise.com/)utiliza um enorme banco de dados de estruturas
moleculares para realizar análises sobre quais moléculas atenderão a uma determinada necessidade.
Em 2015, os pesquisadores usaram o Atomwise para criar medicamentos que tornariam o Ebola
menos propenso a infectar outras pessoas. A análise que levaria meses ou possivelmente anos para
ser realizada por pesquisadores humanos levou apenas um dia para ser concluída pela Atomwise.
Imagine esse cenário em meio a uma epidemia potencialmente global. Se o Atomwise puder realizar a
análise necessária para tornar o vírus ou bactéria não contagioso em um dia, a epidemia potencial
poderá ser reduzida antes de se espalhar.
Os medicamentos podem assumir várias formas. Algumas pessoas pensam que eles vêm apenas em
forma de pílula ou injeção, mas seu corpo produz uma ampla gama de medicamentos na forma de
microbiomas. Na verdade, seu corpo contém dez vezes mais micróbios do que células humanas, e
muitos desses micróbios são essenciais para a vida; você morreria rapidamente sem eles. Bioma
inteiro (https://www.wholebiome.com/)está usando uma variedade de métodos para fazer com que
esses microbiomas funcionem melhor para você, para que você não precise necessariamente de uma
pílula ou injeção para curar alguma coisa. Confira o vídeo emhttps://
www.youtube.com/watch?v=t1Y2AckssyIpara informações adicionais.
Combinando robôs e
profissionais médicos
Robôs semiautônomos com capacidades limitadas estão começando a se integrar à
sociedade. O Japão já usa esses robôs há algum tempo (vejahttps://
www.japantimes.co.jp/news/2017/05/18/national/science-health/japansnursing-
facilities-using-humanoid-robots-improve-lives-safety-
idoso/).Os robôs também estão aparecendo na América na forma de Rudy (ver
http://www.roboticstrends.com/article/rudy_assistive_robot_helps_
senior_age_in_place/health_sports).Na maioria dos casos, esses robôs podem
executar tarefas simples, como lembrar as pessoas de tomar medicamentos e jogar jogos
simples, sem muita intervenção. No entanto, quando necessário, um médico ou outro
profissional médico pode assumir o controle do robô de um local remoto e executar
tarefas mais avançadas por meio do robô. Usar essa abordagem significa que a pessoa
obtém ajuda instantânea quando necessário, reduzindo possíveis danos ao paciente e
mantendo os custos baixos.
Esses tipos de robôs estão em sua infância agora, mas espere vê-los melhorar com o tempo.
Embora esses robôs sejam ferramentas para auxiliar o pessoal médico e não possam realmente
substituir um médico ou enfermeira em muitas tarefas especializadas, eles fornecem a
vigilância constante de que os pacientes precisam, juntamente com uma presença
reconfortante. Além disso, os robôs podem reduzir a necessidade de contratar humanos para
executar tarefas comuns e repetitivas (como dispensar comprimidos, fornecer lembretes e
ajudar a caminhar) que os robôs podem executar muito bem até agora.
»Compartilhando ideias
»Empregando multimídia
Capítulo8
Confiando na IA para melhorar
a interação humana
P
as pessoas interagem umas com as outras de inúmeras maneiras. Na verdade, poucas
pessoas percebem quantas formas diferentes de comunicação ocorrem. Quando muitas
pessoas pensam em comunicação, pensam em escrever ou falar. No entanto, a
interação pode assumir muitas outras formas, incluindo contato visual, qualidade tonal,
e até cheiro (verhttps://www.smithsonianmag.com/science-nature/thetruth-about-
pheromones-100363955/).Um exemplo da versão para computador de
interação humana aprimorada é o nariz eletrônico, que depende de uma combinação de
eletrônica, bioquímica e inteligência artificial para realizar sua tarefa e tem sido aplicado
a uma ampla gama de aplicações e pesquisas industriais (consultehttps://
www.ncbi.nlm.nih.gov/pmc/articles/PMC3274163/).Este capítulo concentra
mais ao longo das linhas de comunicação padrão, no entanto, incluindo a linguagem corporal.
Você obtém uma melhor compreensão de como a IA pode aprimorar a comunicação humana
por meios menos dispendiosos do que construir seu próprio nariz eletrônico.
A IA também pode melhorar a maneira como as pessoas trocam ideias. Em alguns casos, a IA fornece
métodos inteiramente novos de comunicação, mas, em muitos casos, a IA fornece um método sutil
(ou às vezes não tão sutil) de aprimorar as formas existentes de trocar ideias. Os seres humanos
dependem da troca de ideias para criar novas tecnologias, desenvolver tecnologias existentes ou
aprender sobre as tecnologias necessárias para aumentar o conhecimento de um indivíduo. As ideias
são abstratas, o que às vezes torna a troca particularmente difícil, de modo que a IA pode fornecer
uma ponte necessária entre as pessoas.
A seção final deste capítulo ajuda você a entender como uma IA pode lhe dar uma percepção
sensorial quase sobre-humana. Talvez você realmente queira aquele nariz eletrônico, afinal; ele
oferece vantagens significativas na detecção de aromas que são significativamente menos
aromáticos do que os humanos podem cheirar. Imagine ser capaz de cheirar no mesmo nível
que um cachorro (que usa 100 milhões de receptores de aroma, contra os 1 milhão de
receptores de aroma que os humanos possuem). Acontece que duas maneiras permitem
atingir esse objetivo: usando monitores que um humano acessa indiretamente e estimulação
direta da percepção sensorial humana.
Os dois primeiros métodos são abstrações diretas da palavra falada. Eles nem sempre são
fáceis de implementar, mas as pessoas têm feito isso por milhares de anos. O componente de
linguagem corporal é o mais difícil de implementar porque você está tentando criar uma
abstração de um processo físico. A escrita ajuda a transmitir a linguagem corporal usando
terminologia específica, como a descrita emhttps://writerswrite.
co.za/cheat-sheets-for-writing-body-language/.No entanto, a palavra escrita
fica aquém, então as pessoas o complementam com símbolos, como emoticons e emoji (leia
sobre suas diferenças emhttps://www.britannica.com/demystified/whatsthe-
difference-between-emoji-and-emoticons).As seções a seguir descrevem
discutir essas questões com mais detalhes.
O emoticon é uma tecnologia mais antiga e muitas pessoas estão tentando ao máximo
esquecê-lo (mas provavelmente não conseguirão). O emoji, no entanto, é novo e emocionante
suficiente para justificar um filme (verhttps://www.amazon.com/exec/obidos/ASIN/
B0746ZZR71/datacservip0f-20/).Você também pode contar com a IA do Google para transformar seu
selfies em emoji (vejahttps://www.fastcodesign.com/90124964/exclusivenew-google-
tool-uses-ai-to-create-custom-emoji-of-you-from-a-selfie).
Apenas no caso de você realmente não querer vasculhar os 2.666 emojis oficiais que o
Unicode suporta (ou os 564 quatrilhões de emojis que o Allo do Google,https://allo.
google.com/,pode gerar), você pode confiar em Dango (https://play.google.com/store/
apps/details?id=co.dango.emoji.gif&hl=en)para sugerir um emoji apropriado para você
(consultehttps://www.technologyreview.com/s/601758/this-appknows-just-the-right-
emoji-for-any-occasion/).
Os seres humanos criaram novos alfabetos para atender a necessidades específicas desde o
início da palavra escrita. Emoticons e emojis representam dois dos muitos alfabetos que você
pode contar com a criação dos humanos como resultado da Internet e do uso da IA. Na
verdade, pode exigir uma IA para acompanhar todos eles.
Uma das coisas que você deve observar na Figura 8-1 é que o Google Tradutor se oferece para
detectar automaticamente o idioma para você. O que é interessante sobre esse recurso é que
ele funciona extremamente bem na maioria dos casos. Parte da responsabilidade por esse
recurso é o sistema Google Neural Machine Translation (GNMT). Na verdade, ele pode
examinar frases inteiras para entendê-las e fornecer traduções melhores do que aplicativos que
usam frases ou palavras como base para criar uma tradução (consulte
http://www.wired.co.uk/article/google-ai-language-createpara detalhes).
O que é ainda mais impressionante é que o GNMT pode traduzir entre idiomas mesmo
quando não tem um tradutor específico, usando uma linguagem artificial, uminter-
língua(verhttps://en.oxforddictionaries.com/definition/interlingua).
No entanto, é importante perceber que um interlíngua não funciona como um tradutor
universal; é mais uma ponte universal. Diga que o GNMT não sabe traduzir entre chinês e
espanhol. No entanto, pode traduzir entre chinês e inglês e entre inglês e espanhol. Ao
construir uma rede 3-D representando esses três idiomas (a interlíngua), o GNMT é capaz
de criar sua própria tradução entre chinês e espanhol. Infelizmente, este sistema não
funcionará para traduzir entre chinês e marciano porque ainda não há nenhum método
disponível para entender e traduzir marciano em qualquer outro idioma humano. Os
humanos ainda precisam criar uma tradução básica para que o GNMT faça seu trabalho.
»Postura
»Movimento da cabeça
Claro, existem outras características, mas mesmo que uma IA consiga reduzir essas cinco áreas,
ela pode percorrer um longo caminho para fornecer uma interpretação correta da linguagem
corporal. Além da linguagem corporal, as implementações atuais de IA também levam em
consideração características como qualidade tonal, o que torna uma IA extremamente
complexa que ainda não chega nem perto de fazer o que o cérebro humano faz aparentemente
sem esforço.
Uma vez que uma IA pode ler a linguagem corporal, ela também deve fornecer um meio de
produzi-la ao interagir com humanos. Dado que a leitura está em sua infância, a apresentação
robótica ou gráfica da linguagem corporal é ainda menos desenvolvida. O artigo emhttps://
spectrum.ieee.org/video/robotics/robotics-software/robots-learn-to-
falar-linguagem-corporalaponta que os robôs atualmente podem interpretar a linguagem
corporal e reagir adequadamente em alguns poucos casos. Atualmente, os robôs não
conseguem criar boas expressões faciais, então, de acordo com o artigo emhttp://
theconversation.com/realistic-robot-faces-arent-enough-we-needemotion-to-put-us-
at-ease-with-androids-43372,o melhor cenário é
substitua a postura, o movimento da cabeça e os gestos pela linguagem corporal. O resultado ainda
não é tão impressionante.
Trocando Idéias
Uma IA não tem ideias porque carece de inteligência intrapessoal e capacidade de
compreensão. No entanto, uma IA pode permitir que os humanos troquem ideias de
maneira a criar um todo maior que a soma de suas partes. Em muitos casos, a IA não está
realizando nenhum tipo de troca. Os humanos envolvidos no processo realizam a troca
contando com a IA para aumentar o processo de comunicação. As seções a seguir
fornecem detalhes adicionais sobre como esse processo ocorre.
Criando conexões
Um humano pode trocar ideias com outro humano, mas apenas enquanto os dois humanos se
conhecerem. O problema é que muitos especialistas em um determinado campo não se
conhecem de fato - pelo menos não o suficiente para se comunicar. Uma IA pode realizar
pesquisas com base no fluxo de ideias que um ser humano fornece e, em seguida, criar
conexões com outros seres humanos que tenham o mesmo (ou semelhante) fluxo de ideias.
Aumentando a comunicação
Para trocar ideias com sucesso, dois humanos precisam se comunicar bem. O único
problema é que os humanos às vezes não se comunicam bem e às vezes nem se
comunicam. A questão não é apenas traduzir palavras, mas também ideias. Os
preconceitos sociais e pessoais dos indivíduos podem impedir a comunicação porque
uma ideia para um grupo pode não se traduzir em nada para outro grupo. Por exemplo,
as leis de um país podem fazer alguém pensar de uma maneira, mas as leis de outro país
podem fazer o outro ser humano pensar de uma maneira totalmente diferente.
Teoricamente, uma IA poderia ajudar a comunicação entre grupos díspares de várias maneiras.
Obviamente, a tradução de idiomas (supondo que a tradução seja precisa) é um desses
métodos. No entanto, uma IA pode fornecer pistas sobre o que é e o que não é culturalmente
aceitável ao pré-selecionar materiais. Usando a categorização, uma IA também pode sugerir
ajudas como gráficos alternativos e assim por diante para ajudar a comunicação a ocorrer de
uma maneira que ajude ambas as partes.
Definindo tendências
Os seres humanos geralmente baseiam ideias em tendências. No entanto, para visualizar como a ideia
funciona, outras partes na troca de ideias também devem ver essas tendências, e a comunicação
usando esse tipo de informação é notoriamente difícil. A IA pode executar vários níveis de análise de
dados e apresentar a saída graficamente. A IA pode analisar os dados de mais maneiras e mais
rapidamente do que um ser humano, para que a história que os dados contam seja especificamente
aquela que você precisa contar. Os dados permanecem os mesmos; a apresentação e interpretação da
mudança de dados.
Estudos mostram que os humanos se relacionam melhor com a saída gráfica do que com a saída tabular, e a
saída gráfica definitivamente tornará as tendências mais fáceis de ver. Conforme descrito em
http://sphweb.bumc.bu.edu/otlt/mph-modules/bs/datapresentation/
DataPresentation2.html,você geralmente usa dados tabulares para apresentar apenas informações
específicas; gráficos sempre funcionam melhor para mostrar tendências. O uso de aplicativos
orientados por IA também pode facilitar a criação do tipo certo de saída gráfica para um
Usando Multimídia
A maioria das pessoas aprende usando múltiplos sentidos e múltiplas abordagens. Uma
porta de aprendizado que funciona para uma pessoa pode deixar outra completamente
perplexa. Consequentemente, quanto mais maneiras uma pessoa puder comunicar
conceitos e ideias, mais provável será que outras pessoas entendam o que a pessoa está
tentando comunicar. A multimídia normalmente consiste em som, gráficos, texto e
animação, mas algumas multimídia fazem mais.
A IA pode ajudar com multimídia de várias maneiras. Uma das mais importantes está na
criação, ou autoria, da multimídia. Você encontra IA em aplicativos que ajudam em tudo,
desde o desenvolvimento de mídia até a apresentação de mídia. Por exemplo, ao traduzir
as cores em uma imagem, uma IA pode fornecer o benefício de ajudá-lo a visualizar os
efeitos dessas alterações mais rapidamente do que tentar uma combinação de cores por
vez (a abordagem de força bruta).
Depois de usar multimídia para apresentar ideias em mais de uma forma, aqueles que
recebem as ideias devem processar as informações. Um uso secundário da IA depende
do uso de redes neurais para processar as informações de várias maneiras. Categorizar a
multimídia é um uso essencial da tecnologia hoje. No entanto, no futuro, você pode
esperar usar IA para ajudar na reconstrução 3D de cenas com base em imagens 2D.
Imagine a polícia sendo capaz de percorrer uma cena de crime virtual com todos os
detalhes capturados fielmente.
No entanto, mudar e filtrar cores, sons e cheiros manualmente pode exigir muito tempo, e os
resultados podem decepcionar mesmo quando executados com habilidade, que é onde a IA
entra em ação. Uma IA pode tentar várias combinações muito mais rapidamente do que um ser
humano e localizar as combinações potencialmente úteis com maior facilidade porque uma IA
executa a tarefa de maneira consistente.
O aumento físico dos sentidos humanos já ocorre de várias maneiras e é garantido que aumentará à
medida que os humanos se tornarem mais receptivos a vários tipos de implantes. Por exemplo, os
óculos de visão noturna atualmente permitem que os humanos vejam à noite, com modelos de última
geração que fornecem visão de cores controlada por um processador especialmente projetado. No
futuro, o aumento/substituição dos olhos pode permitir que as pessoas vejam qualquer parte do
espectro como controlada pelo pensamento, de modo que as pessoas vejam apenas a parte do
espectro necessária para realizar uma tarefa específica.
Capítulo9
Dados de execução
Análise para IA
A
dados em massa não são um fenômeno moderno; as pessoas acumularam dados por
séculos. Não importa se a informação aparece em texto ou forma numérica, as
pessoas sempre apreciaram como os dados descrevem o mundo ao redor e os usam
para levar a civilização adiante. Os dados têm um valor em si. Ao utilizar seu conteúdo, a
humanidade pode aprender, transmitir informações críticas aos descendentes (sem
necessidade de reinventar a roda) e atuar efetivamente no mundo.
A era atual é chamada de era da informação não apenas porque nos tornamos tão ricos
em dados, mas também porque a sociedade atingiu uma certa maturidade em analisar e
extrair informações deles. Empresas como Alphabet (Google), Amazon, Apple, Facebook e
Microsoft, que construíram seus negócios com base em dados, são vistas como as cinco
empresas mais valiosas do mundo. Essas empresas não apenas coletam e mantêm dados
armazenados fornecidos por seus processos digitais; eles também sabem como torná-lo
tão valioso quanto o petróleo, empregando análises de dados precisas e elaboradas. O
Google, por exemplo, registra dados da web em geral e de seu próprio buscador, entre
outros.
Você pode ter encontrado o mantra “dados são o novo petróleo” nas notícias, em revistas
ou em conferências. A declaração implica que os dados podem enriquecer uma empresa
e que é preciso habilidade e trabalho árduo para que isso aconteça. Embora muitos
tenham empregado o conceito e o tenham tornado incrivelmente bem-sucedido, foi Clive
Humbly, um matemático britânico, quem primeiro comparou dados com petróleo, devido
à sua experiência com dados de consumidores no setor de varejo. Humbly é conhecido
por estar entre os fundadores da Dunnhumby, uma empresa de marketing do Reino
Unido, e a mente por trás do programa de cartões de fidelidade da Tesco. Em 2006,
Humbly também enfatizou que dados não são apenas dinheiro que cai do céu; requer
esforço para torná-lo útil. Assim como você não pode usar óleo não refinado
imediatamente porque ele tem que ser transformado em outra coisa por processos
químicos que o transformam em gás, plástico,
As transformações de dados mais básicas são chamadasanálise de dados,e você pode considerá-los
como as transformações químicas básicas pelas quais o petróleo passa em uma refinaria antes de se
tornar um combustível valioso ou produtos plásticos. Usando apenas a análise de dados, você pode
estabelecer a base para processos de análise de dados mais avançados que podem ser aplicados aos
dados. A análise de dados, dependendo do contexto, refere-se a um grande corpo de possíveis
operações de dados, às vezes específicas para certas indústrias ou tarefas. Você pode categorizar
todas essas transformações em quatro grandes famílias gerais que fornecem uma ideia do que
acontece durante a análise de dados:
O que dificulta a análise de dados na era do big data são os grandes volumes de dados
que exigem ferramentas especiais, como o Hadoop (http://hadoop.apache.org/)e
Apache Spark (https://spark.apache.org/),que são duas ferramentas de software usadas
para executar operações de dados massivas. Apesar dessas ferramentas avançadas,
ainda é uma questão de suor preparar manualmente até 80% dos dados.
Hoje, a atenção mudou da produção de dados para a preparação de dados usando a análise de dados.
A ideia é que várias fontes já produzam dados em quantidades tão grandes que você possa encontrar
o que precisa sem precisar criar dados especiais para a tarefa. Por exemplo, imagine querer que uma
IA controle a porta do seu animal de estimação para deixar cães e gatos entrarem, mas manter outros
animais fora. Algoritmos modernos de IA aprendem com dados específicos de tarefas, o que significa
processar um grande número de imagens mostrando exemplos de cães, gatos e outros animais.
Provavelmente, um conjunto tão grande de imagens chegará da Internet, talvez de sites sociais ou
pesquisas de imagens. Anteriormente, realizar uma tarefa semelhante significava que os algoritmos
usariam apenas algumas entradas específicas sobre formas, tamanhos e características distintas dos
animais, por exemplo. A escassez de dados significava que eles poderiam realizar apenas algumas
tarefas limitadas. Na verdade, não existem exemplos de uma IA que possa alimentar uma porta de
animais de estimação usando algoritmos clássicos ou sistemas especializados.
»Os dados descrevem melhor o mundo apresentando uma ampla variedade de fatos e, em
mais detalhes, fornecendo nuances para cada fato. Tornou-se tão abundante que cobre
todos os aspectos da realidade. Você pode usá-lo para desvendar como coisas e fatos
aparentemente não relacionados realmente se relacionam entre si.
»Os dados mostram como os fatos se associam aos eventos. Você pode derivar regras gerais
e aprender como o mundo mudará ou se transformará, dadas certas premissas. Quando as pessoas
agem de uma determinada maneira, os dados também fornecem uma certa capacidade preditiva.
Em alguns aspectos, os dados nos fornecem novos superpoderes. Cris Anderson, Com fio
editor-chefe anterior, discute como grandes quantidades de dados podem ajudar
descobertas científicas fora do método científico (veja o artigo emhttps://
www.wired.com/2008/06/pb-theory/).O autor se baseia no exemplo de
conquistas do Google nos setores de negócios de publicidade e tradução, nos quais o
Google alcançou proeminência não usando modelos ou teorias específicas, mas
aplicando algoritmos para aprender com os dados.
Mais do que simplesmente alimentar a IA, os dados tornam a IA possível. Algumas pessoas diriam que a
IA é o resultado de algoritmos sofisticados de elevada complexidade matemática, e isso certamente é
verdade. Atividades como visão e compreensão da linguagem requerem algoritmos que não são
facilmente explicados em termos leigos e requerem milhões de cálculos para funcionar. (O hardware
também desempenha um papel aqui.)
Wissner-Gross analisa o momento da maioria das conquistas revolucionárias de IA nos últimos anos,
mostrando como os dados e os algoritmos contribuem para o sucesso de cada avanço e destacando
como cada um deles era novo no momento em que o marco foi alcançado. Wissner-Gross mostra como
os dados são relativamente novos e sempre atualizados, enquanto os algoritmos não são novas
descobertas, mas dependem da consolidação de tecnologias mais antigas.
As conclusões das reflexões de Wissner-Gross são que, em média, o algoritmo costuma ser 15 anos mais
antigo que os dados. Ele aponta que os dados estão impulsionando as conquistas da IA e deixa o leitor
se perguntando o que poderia acontecer se fosse possível alimentar os algoritmos atualmente disponíveis
com melhores dados em termos de qualidade e quantidade.
Para se ter uma ideia do que acontece no processo de treinamento, imagine uma criança
aprendendo a distinguir árvores de outros objetos. Antes que a criança possa fazê-lo de forma
independente, um professor apresenta à criança um certo número de imagens de árvores,
completas com todos os fatos que tornam uma árvore distinguível de outros objetos do
mundo. Tais fatos podem ser características como o material da árvore (madeira), suas partes
(tronco, galhos, folhas ou agulhas, raízes) e localização (plantada no solo).
Tal representação (regras abstratas derivadas de fatos do mundo real) é possível porque o
algoritmo de aprendizado possui muitos parâmetros internos (consistindo de vetores e
matrizes de valores), que equivalem à memória do algoritmo para ideias que são adequadas
para sua atividade de mapeamento que conecta recursos para classes de resposta. As
dimensões e o tipo de parâmetros internos delimitam o tipo de funções de destino que um
algoritmo pode aprender. Um mecanismo de otimização no algoritmo altera os parâmetros de
seus valores iniciais durante o aprendizado para representar a função oculta do alvo.
Você pode imaginar esta fase como o momento em que uma criança experimenta muitas ideias
criativas diferentes reunindo conhecimentos e experiências (uma analogia para o
Entendendo os benefícios do
aprendizado de máquina
Você encontra IA e aprendizado de máquina usados em muitos aplicativos hoje. O único
problema é que a tecnologia funciona tão bem que você nem sabe que ela existe. Na verdade,
você pode se surpreender ao descobrir que muitos dispositivos em sua casa já usam ambas as
tecnologias. Ambas as tecnologias aparecem definitivamente em seu carro e no local de
trabalho. Na verdade, os usos da IA e do aprendizado de máquina chegam aos milhões - todos
seguros fora de vista, mesmo quando são bastante dramáticos por natureza. Aqui estão apenas
algumas das maneiras pelas quais você pode ver a IA usada:
»Análise complexa:Os seres humanos geralmente precisam de ajuda com análises complexas porque
existem literalmente muitos fatores a serem considerados. Por exemplo, o mesmo conjunto de
sintomas pode indicar mais de um problema. Um médico ou outro especialista pode precisar de
ajuda para fazer um diagnóstico em tempo hábil para salvar a vida de um paciente.
»Atendimento ao Cliente:A linha de atendimento ao cliente para a qual você liga hoje pode nem
tem um humano por trás disso. A automação é boa o suficiente para seguir scripts e usar
vários recursos para lidar com a grande maioria de suas perguntas. Com uma boa inflexão
de voz (fornecida também pela IA), você pode nem conseguir dizer que está falando com
um computador.
muitos sistemas de frenagem automática dependem da IA para parar o carro com base em todas as
Esta lista nem começa a arranhar a superfície. Você pode encontrar a IA usada de muitas outras
maneiras. No entanto, também é útil visualizar os usos do aprendizado de máquina fora do
domínio normal que muitos consideram o domínio da IA. Aqui estão alguns usos para
aprendizado de máquina que você pode não associar a uma IA:
»Controle de acesso:Em muitos casos, o controle de acesso é uma proposição sim ou não. Um
o cartão inteligente do funcionário concede acesso a um recurso da mesma maneira que as
pessoas usam as chaves há séculos. Alguns bloqueios oferecem a capacidade de definir horários
e datas em que o acesso é permitido, mas o controle de baixa granularidade realmente não
atende a todas as necessidades. Ao usar o aprendizado de máquina, você pode determinar se um
funcionário deve obter acesso a um recurso com base na função e na necessidade. Por exemplo,
um funcionário pode obter acesso a uma sala de treinamento quando o treinamento reflete uma
função do funcionário.
»Proteção animal:O oceano pode parecer grande o suficiente para permitir que animais e
naves para coabitar sem problemas. Infelizmente, muitos animais são atingidos por navios
todos os anos. Um algoritmo de aprendizado de máquina pode permitir que os navios
evitem os animais aprendendo os sons e as características do animal e do navio.
»Prevendo tempos de espera:A maioria das pessoas não gosta de esperar quando não tem ideia
quanto tempo será a espera. O aprendizado de máquina permite que um aplicativo determine os tempos
de espera com base nos níveis de pessoal, carga de pessoal, complexidade dos problemas que a equipe
Por exemplo, a Microsoft treinou sua IA, Tay, para conversar com seres humanos no Twitter e
aprender com suas respostas. Infelizmente, as interações deram errado porque os usuários
expuseram Tay ao discurso de ódio, levantando preocupações sobre a qualidade de qualquer IA
alimentada pela tecnologia de aprendizado de máquina. (Você pode ler um pouco da história
nohttps://www.theverge.com/2016/3/24/11297050/tay-microsoft-chatbot-
racista.)O problema era que o algoritmo de aprendizado de máquina foi alimentado com dados ruins
e não filtrados (a Microsoft não usou a análise de dados apropriada para limpar e equilibrar a entrada
apropriadamente), o que superajustou o resultado. O overfitting selecionou o conjunto errado de
funções para representar o mundo de uma maneira geral, conforme necessário, para evitar o
fornecimento de resultados não conformes, como discurso de ódio. Outras IAs treinadas para
conversar com humanos, como a premiada Mitsuku (http://www.mitsuku.com/), não estão expostos
aos mesmos riscos que Tay porque seu aprendizado é estritamente controlado e supervisionado por
análise de dados e avaliação humana.
»Aprendizagem supervisionada
»Aprendizagem não supervisionada
As seções a seguir discutem quais tipos diferentes de algoritmos são explorados pelo
aprendizado de máquina com mais detalhes.
Aprendizagem supervisionada
O aprendizado por reforço está conectado a aplicativos para os quais o algoritmo deve tomar decisões
(portanto, o produto é prescritivo, não apenas descritivo, como no aprendizado não supervisionado), e
as decisões trazem consequências. No mundo humano, é como aprender por tentativa e erro. Os
erros ajudam você a aprender porque eles têm uma penalidade adicionada (custo, perda de tempo,
arrependimento, dor e assim por diante), ensinando que um determinado curso de ação tem menos
probabilidade de sucesso do que outros. Um exemplo interessante de aprendizado por reforço ocorre
quando os computadores aprendem a jogar videogames sozinhos.
Nesse caso, um aplicativo apresenta ao algoritmo exemplos de situações específicas, como ter
o jogador preso em um labirinto enquanto evita um inimigo. O aplicativo permite que o
algoritmo saiba o resultado das ações que realiza, e o aprendizado ocorre ao tentar evitar o
que descobre ser perigoso e buscar a sobrevivência. Você pode ver como o Google DeepMind
criou um programa de aprendizado por reforço que reproduz videogames antigos do Atari em
https://www.youtube.com/watch?v=V1eYniJ0Rnk.Ao assistir ao vídeo, observe como o
programa é inicialmente desajeitado e pouco qualificado, mas melhora constantemente com o
treinamento até se tornar um campeão. O processo é descrito como pontos fortes e fracos por
Raia Hadsell, cientista pesquisadora sênior da equipe de Deep Learning da DeepMind, em uma
palestra esclarecedora.
finalizando o vídeo do TEDx Talks emhttps://www.youtube.com/watch?v=mqma6GpM7vM.
NESTE CAPÍTULO
Capítulo 10
Máquina Empregadora
Aprendizagem em IA
eu
ganhar tem sido uma parte importante da IA desde o início porque a IA pode imitar um nível
de inteligência semelhante ao humano. Alcançar um nível de mímica que efetivamente se
assemelha ao aprendizado levou muito tempo e uma variedade de abordagens. Hoje, o
aprendizado de máquina pode se orgulhar de um nível quase humano de aprendizado em tarefas
específicas, como classificação de imagem ou processamento de som, e está se esforçando para
alcançar um nível semelhante de aprendizado em muitas outras tarefas.
O aprendizado de máquina não é totalmente automatizado. Você não pode dizer a um computador
para ler um livro e esperar que ele entenda alguma coisa. A automação implica que os computadores
podem aprender a se programar para executar tarefas, em vez de esperar que os humanos os
programem. Atualmente, a automação requer grandes quantidades de dados selecionados por
humanos, bem como análise de dados e treinamento (novamente, sob supervisão humana). É como
pegar uma criança pela mão para guiar os primeiros passos da criança. Além disso, o aprendizado de
máquina tem outros limites, que são ditados pela forma como ele aprende com os dados.
Cada família de algoritmos tem maneiras específicas de realizar tarefas, e este capítulo
descreve esses métodos. O objetivo é entender como a IA toma decisões e faz previsões.
Como descobrir o homem por trás da cortina noMágico de Oz,você descobre o
maquinário e o operador por trás da IA neste capítulo.
Assim como os seres humanos têm maneiras diferentes de aprender com o mundo, os
cientistas que abordaram o problema do aprendizado da IA seguiram caminhos diferentes.
Cada um acreditava em uma receita particular para imitar a inteligência. Até agora, nenhum
modelo provou ser superior a qualquer outro. Osem almoço grátisteorema de ter que pagar
por cada benefício está em pleno vigor. Cada um desses esforços provou ser eficaz na solução
de problemas específicos. Como os algoritmos são equivalentes em resumo (consulte a barra
lateral “Sem almoço grátis”), nenhum algoritmo é superior ao outro, a menos que seja
comprovado em um problema prático específico. As seções a seguir fornecem informações
adicionais sobre esse conceito de usar diferentes métodos para aprender.
Um algoritmo é uma espécie de contêiner. Ele fornece uma caixa para armazenar um método
para resolver um determinado tipo de problema. Algoritmos processam dados através de uma
série de estados bem definidos. Os estados não precisam ser determinísticos, mas os estados
são definidos mesmo assim. O objetivo é criar uma saída que resolva um problema. Em alguns
casos, o algoritmo recebe entradas que ajudam a definir a saída, mas o foco está sempre na
saída.
Um teorema comum no folclore matemático é o teorema do almoço sem graça de David Wolpert
e William Macready, que afirma que quaisquer dois algoritmos de otimização são equivalentes
quando seu desempenho é calculado em média em todos os problemas possíveis.
Essencialmente, não importa qual algoritmo de otimização você use, não haverá nenhuma
vantagem em usá-lo em todos os problemas possíveis. Para obter uma vantagem, você deve usá-
la nos problemas em que o algoritmo se destaca. O papel de Yo-Chi Ho e David
L. Pepyne emhttps://www.researchgate.net/publication/
3934675_Simple_explanation_of_the_no_free_lunch_theorem_of_optimizationfornece um
explicação acessível, mas rigorosa do teorema. Também é uma boa ideia revisar a discussão em
http://www.no-free-lunch.org/para obter mais detalhes sobre os teoremas do almoço sem graça;
O aprendizado de máquina depende de dois deles.
Conforme descrito na seção “Evitando o hype da IA” do Capítulo 1, cada uma das cinco tribos
tem uma técnica e uma estratégia diferentes para resolver problemas que resultam em
algoritmos exclusivos. A combinação desses algoritmos deve levar eventualmente ao algoritmo
mestre que será capaz de resolver qualquer problema. As seções a seguir fornecem uma visão
geral das cinco principais técnicas algorítmicas.
raciocínio simbólico
Uma das primeiras tribos, os simbolistas, acreditava que o conhecimento poderia ser
obtido operando-se em símbolos (sinais que representam um certo significado ou
evento) e derivando regras deles. Ao reunir sistemas complexos de regras, você pode
obter uma dedução lógica do resultado que deseja saber, portanto, os simbolistas
moldaram seus algoritmos para produzir regras a partir de dados. No raciocínio
simbólico, deduçãoexpande o domínio do conhecimento humano, enquantoinduçãoeleva
o nível do conhecimento humano. A indução geralmente abre novos campos de
exploração, enquanto a dedução explora esses campos.
inferência bayesiana
Um grupo de cientistas, chamados bayesianos, percebeu que a incerteza era o aspecto
chave a ser observado e que o aprendizado não era garantido, mas ocorria como uma
atualização contínua de crenças anteriores que se tornavam cada vez mais precisas. Essa
percepção levou os bayesianos a adotarem métodos estatísticos e, em particular,
derivações do teorema de Bayes, que ajudam a calcular probabilidades em condições
específicas (por exemplo, ver uma carta de um determinadosemente,o valor inicial para
uma sequência pseudo-aleatória, retirada de um baralho após três outras cartas da
mesma semente).
»Baías ingénuas:Este algoritmo pode ser mais preciso do que um médico em diagnósticos.
em certas doenças. Além disso, o mesmo algoritmo pode detectar spam e prever o
sentimento do texto. Também é amplamente utilizado na indústria da Internet para tratar
facilmente grandes quantidades de dados.
Todas essas seções discutem tipos de algoritmos. Esses tipos de algoritmos são divididos
em subcategorias. Por exemplo, as árvores de decisão vêm categorizadas como árvores
de regressão, árvores de classificação, árvores reforçadas, agregadas de bootstrap e
floresta de rotação. Você pode até detalhar os subtipos das subcategorias. Um
classificador de floresta aleatório é um tipo de agregação de bootstrap, e há ainda mais
níveis a partir daí. Depois de passar dos níveis, você começa a ver os algoritmos reais,
que chegam aos milhares. Resumindo, este livro oferece uma visão geral de um tópico
infinitamente mais complexo que pode exigir muitos volumes para cobrir em detalhes. O
ponto principal é entender o tipo de algoritmo e não ficar atolado em detalhes.
1.Algumas situações não podem oferecer certeza porque são de natureza aleatória. Situações
semelhantes são inerentemente estocásticas. Por exemplo, em jogos de cartas, você não pode
ter certeza de qual mão terá depois que o dealer embaralhar e distribuir as cartas.
2.Mesmo que uma situação não seja aleatória, não observar todos os seus aspectos (observação
incompleta) gera incerteza sobre como as coisas vão acontecer. Por exemplo, um robô
andando por um corredor lotado de pessoas não pode saber a direção pretendida de cada
pessoa (não pode ler suas mentes), mas pode formular um palpite com base em uma
observação parcial de seu comportamento. Como em qualquer palpite, o robô tem uma
chance de acertar e errar.
As probabilidades estão entre 0 e 1; nenhuma probabilidade pode exceder tais limites. Você
define probabilidades empiricamente a partir de observações. Simplesmente conte o número
de vezes que um evento específico acontece em relação a todos os eventos que lhe interessam.
Por exemplo, digamos que você queira calcular a probabilidade de quantas vezes a fraude
acontece ao fazer transações bancárias ou quantas vezes as pessoas contraem uma
determinada doença em um determinado país. Depois de testemunhar o evento, você pode
estimar a probabilidade associada a ele contando o número de vezes que o evento ocorre e
dividindo pelo número total de eventos.
Você pode contar o número de vezes que a fraude ou a doença ocorre usando dados
registrados (principalmente retirados de bancos de dados) e depois dividir esse número pelo
número total de eventos genéricos ou observações disponíveis. Portanto, você divide o número
de fraudes pelo número de transações em um ano ou conta o número de pessoas que
adoeceram durante o ano em relação à população de uma determinada área. O resultado é um
número que varia de 0 a 1, que você pode usar como sua probabilidade de linha de base para
um determinado evento em determinadas circunstâncias.
Contar todas as ocorrências de um evento nem sempre é possível, então você precisa saber
sobre amostragem. Por amostragem, que é um ato baseado em certas expectativas de
probabilidade, você pode observar uma pequena parte de um conjunto maior de eventos ou
objetos, mas ser capaz de inferir probabilidades corretas para um evento, bem como medidas
exatas, como medições quantitativas ou qualitativas classes relacionadas a um conjunto de
objetos. Por exemplo, se você deseja acompanhar as vendas de carros nos Estados Unidos no
último mês, não precisa acompanhar todas as vendas no país. Usando uma amostra que
compreende as vendas de alguns vendedores de carros em todo o país, você pode determinar
medidas quantitativas, como o preço médio de um carro vendido, ou medidas qualitativas,
como o modelo de carro vendido com mais frequência.
Por exemplo, quando você joga uma moeda, se a moeda for honesta, a probabilidade a priori
de dar cara é de cerca de 50% (quando você também assume a existência de uma pequena
probabilidade de a moeda cair na borda). Não importa quantas vezes você jogue a moeda,
quando confrontado com um novo lance, a probabilidade de cara ainda é de cerca de 50 por
cento. No entanto, em algumas outras situações, se você mudar o contexto, a probabilidade a
priori não é mais válida porque algo sutil aconteceu e mudou. Nesse caso, você pode expressar
essa crença como umaprobabilidade a posteriori,que é a probabilidade a priori depois que algo
aconteceu para modificar a contagem.
Por exemplo, a probabilidade a priori de uma pessoa ser do sexo feminino é de cerca de 50%. No
entanto, a probabilidade pode diferir drasticamente se você considerar apenas faixas etárias
específicas, porque as mulheres tendem a viver mais e, após uma certa idade, a faixa etária mais velha
contém mais mulheres do que homens. Como outro exemplo relacionado ao gênero, em geral, as
mulheres atualmente superam os homens nas principais universidades (ver
https://www.theguardian.com/education/datablog/2013/jan/29/how-manymen-and-
women-are-studying-at-my-universityehttps://www.ucdavis. edu/news/gender-gap-
more-female-students-menes-attending-universities/
como exemplos desse fenômeno). Portanto, dados esses dois contextos, a probabilidade
a posteriori é diferente da esperada a priori. Em termos de distribuição de gênero, a
natureza e a cultura podem criar uma probabilidade a posteriori diferente. As seções a
seguir ajudam você a entender a utilidade da probabilidade com mais detalhes.
Na verdade, o algoritmo Naïve Bayes aproveita para aumentar a chance de uma previsão
correta ao conhecer as circunstâncias que cercam a previsão. Tudo começa com o
reverendo Bayes e seu revolucionário teorema das probabilidades. Na verdade, como
observado em outro lugar, no livro uma das tribos de aprendizado de máquina recebe o
nome dele (os bayesianos). Bayesianos usam vários métodos estatísticos para resolver
problemas, todos baseados na observação de probabilidades do resultado desejado no
contexto certo, antes e depois de observar o próprio resultado. Com base nessas
observações, eles resolvem o problema do nascer do sol (estimando a probabilidade de o
sol nascer amanhã) encadeando observações repetidas e atualizando continuamente sua
estimativa da probabilidade de o sol nascer novamente proporcionalmente ao número de
vezes que eles testemunharam uma longa série de amanheceres antes. Você pode ler
sobre o raciocínio bayesiano aplicado a um bebê recém-nascido observando o sol lendo
este artigo que apareceu noEconomistanohttp://www.economist.
com/node/382968.
»P(B|E):A probabilidade de uma crença (B) dado um conjunto de evidências (E) (posterior
probabilidade). Lercrençacomo uma forma alternativa de expressar uma hipótese. Nesse
caso, a hipótese é que a pessoa é do sexo feminino e a prova são os cabelos compridos.
Conhecer a probabilidade de tal crença dada a evidência pode ajudar a prever o sexo da
pessoa com alguma confiança.
»EDUCAÇAO FISICA):A probabilidade geral de ter cabelo comprido. Aqui é outro a priori
probabilidade, desta vez relacionada com a evidência observada. Nesta fórmula, é uma
probabilidade de 35%, que é um valor de 0,35 (evidência).
Se você resolver o problema anterior usando a fórmula de Bayes e os valores que você
escolheu, o resultado é06. * 0,5 / 0,35 = 0,857.Essa é uma alta porcentagem de probabilidade,
o que o leva a afirmar que, diante de tais evidências, a pessoa provavelmente é do sexo
feminino.
Digamos que você esteja preocupado por ter uma doença rara experimentada por 1% da
população. Você faz o teste e os resultados são positivos. Os exames médicos nunca são
perfeitamente precisos, e o laboratório informa que, quando você está doente, o teste é
positivo em 99% dos casos, enquanto que, quando você está saudável, o teste será negativo em
99% dos casos. Agora, usando esses números, você imediatamente acredita que está doente,
dada a alta porcentagem de testes positivos quando uma pessoa está
Se você olhar para o problema usando essa perspectiva, ficará evidente o porquê. Ao
limitar o contexto às pessoas que obtêm uma resposta positiva ao teste, a probabilidade
de estar no grupo dos verdadeiros positivos é a mesma de estar nos falsos positivos.
O algoritmo Naïve Bayes ajuda você a organizar todas as evidências coletadas e chegar a
uma previsão mais sólida com maior probabilidade de estar correta. Evidências reunidas
consideradas individualmente não poderiam salvá-lo do risco de prever
FIGURA 10-1:
A Naive Bayes
modelo pode
retraçar evidências
Para a direita
resultado.
O algoritmo calcula uma pontuação, com base na probabilidade de tomar uma decisão
específica e multiplicada pelas probabilidades das evidências conectadas a essa decisão.
Por exemplo, para determinar se deve jogar tênis quando a perspectiva está ensolarada,
mas o vento está forte, o algoritmo calcula a pontuação para uma resposta positiva
multiplicando a probabilidade geral de jogar (9 jogos disputados em 14 ocorrências) pela
probabilidade do dia de sol (2 em 9 partidas disputadas) e vento forte no tênis (3 em 9
partidas disputadas). As mesmas regras se aplicam para o caso negativo (que tem
diferentes probabilidades de não jogar dadas certas condições):
Como a pontuação da probabilidade é maior, o algoritmo decide que é mais seguro não
jogar nessas condições. Ele calcula essa probabilidade somando as duas pontuações e
dividindo ambas as pontuações por sua soma:
Você pode estender ainda mais o Naïve Bayes para representar relacionamentos que são mais
complexos do que uma série de fatores que sugerem a probabilidade de um resultado usando
um rede bayesiana,que consiste em gráficos que mostram como os eventos afetam uns aos
outros. Os gráficos bayesianos possuem nós que representam os eventos e arcos que mostram
quais eventos afetam os outros, acompanhados de uma tabela de probabilidades condicionais
que mostram como funciona a relação em termos de probabilidade. A Figura 10-2 mostra um
exemplo famoso de rede Bayesiana tirado de um artigo acadêmico de 1988, “Local
FIGURA 10-2:
Um bayesiano
rede pode
apoiar um médico
decisão.
As redes bayesianas, embora intuitivas, têm matemática complexa por trás delas e são
mais poderosas do que um simples algoritmo Naïve Bayes porque imitam o mundo como
uma sequência de causas e efeitos com base na probabilidade. As redes bayesianas são
tão eficazes que você pode usá-las para representar qualquer situação. Eles têm
aplicações variadas, como diagnósticos médicos, fusão de dados incertos provenientes de
vários sensores, modelagem econômica e monitoramento de sistemas complexos, como
um carro. Por exemplo, porque a condução no trânsito rodoviário pode envolver
Uma árvore de decisão é outro tipo de algoritmo chave no aprendizado de máquina que
influencia a implementação e o aprendizado de IA. Os algoritmos de árvore de decisão
não são novos, mas têm uma longa história. O primeiro algoritmo desse tipo remonta à
década de 1970 (com muitas variantes subsequentes). Quando você considera
experimentos e pesquisas originais, o uso de árvores de decisão remonta ainda mais
cedo – desde as percepções. Como o principal algoritmo simbolista, as árvores de decisão
desfrutam de uma longa popularidade porque são um tipo intuitivo de algoritmo. É fácil
traduzir a saída em regras e, portanto, tornar a saída facilmente compreendida pelos
humanos. As árvores de decisão também são extremamente fáceis de usar.
Dividir um problema para chegar facilmente a uma solução também é uma estratégia comum em
muitosdividir e conquistaralgoritmos. Assim como um exército inimigo em batalha, se você puder
dividir seu inimigo e combatê-lo individualmente, poderá obter uma vitória mais fácil.
Usando uma amostra de observações como ponto de partida, o algoritmo refaz as regras
que geraram as classes de saída (ou os valores numéricos ao trabalhar com um problema
de regressão) dividindo a matriz de entrada em partições cada vez menores até que o
processo acione uma regra para parar . Esse retrocesso das regras particulares para as
gerais é típico da dedução inversa humana, conforme tratada pela lógica e pela filosofia.
A divisão ocorre para impor um princípio simples: cada partição dos dados iniciais deve
facilitar a previsão do resultado alvo, que é caracterizado por uma distribuição de classes
(ou valores) diferente e mais favorável do que a amostra original. O algoritmo cria
partições dividindo os dados. Ele determina as divisões de dados avaliando primeiro os
recursos. Em seguida, avalia os valores nas características que poderiam trazer o máximo
de melhoria de uma medida estatística especial — ou seja, a medida que desempenha o
papel da função de custo em uma árvore de decisão.
Na fórmula, você considera todas as classes uma de cada vez e soma o resultado da
multiplicação de cada uma delas. Na multiplicação que cada classe tem que fazer,p(eu)é a
probabilidade para aquela classe (expressa no intervalo de 0 a 1) e
log2é o logaritmo de base 2. Começando com uma amostra na qual você deseja
classificar duas classes com a mesma probabilidade (distribuição 50/50), o máximo
entropia possível éEntropia = -0,5*log2(0,5) -0,5*log2(0,5) = 1,0.Como-
porém, quando o algoritmo da árvore de decisão detecta uma característica que pode dividir o
conjunto de dados em duas partições, onde a distribuição das duas classes é 40/60, a entropia
informativa média diminui:
Observe a soma de entropia para todas as classes. Usando a divisão 40/60, a soma é menor que
o máximo teórico de 1 (diminuindo a entropia). Pense na entropia como uma medida da
confusão nos dados: quanto menos confusão, mais ordem e mais fácil é adivinhar a classe
certa. Após uma primeira divisão, o algoritmo tenta dividir ainda mais as partições obtidas
usando a mesma lógica de redução de entropia. Ele divide progressivamente qualquer partição
de dados sucessiva até que não haja mais divisões possíveis porque a subamostra é um único
exemplo ou porque atendeu a uma regra de parada.
Regras de paradasão limites para a expansão de uma árvore. Essas regras funcionam considerando
três aspectos de uma partição: tamanho da partição inicial, tamanho da partição resultante e ganho
de informação alcançável pela divisão. As regras de parada são importantes porque os algoritmos de
árvore de decisão aproximam um grande número de funções; no entanto, ruídos e erros de dados
podem facilmente influenciar esse algoritmo. Consequentemente, dependendo da amostra, a
instabilidade e variância das estimativas resultantes afetam as previsões da árvore de decisão.
FIGURA 10-3:
Uma visualização de
a árvore de decisão
construído a partir do
Para ler os nós da árvore, basta começar pelo nó mais alto, que corresponde aos dados de
treinamento originais; em seguida, comece a ler as regras. Observe que cada nó tem duas derivações:
o ramo esquerdo significa que a regra superior é verdadeira (declarada como sim em uma caixa
quadrada) e a direita significa que é falsa (declarada como não em uma caixa quadrada).
À direita da primeira regra, você vê uma importante regra terminal (uma folha terminal), em
um círculo, declarando um resultado positivo, Sim, que você pode ler como jogar
tênis=Verdadeiro. De acordo com este nó, quando o clima não está ensolarado (Sol) ou chuvoso
(Chuva), é possível jogar. (Os números sob a folha do terminal mostram quatro exemplos
afirmando esta regra e zero negando-a.) Observe que você poderia entender melhor a regra se
a saída simplesmente declarasse que, quando a perspectiva está nublada, é possível jogar.
Frequentemente, as regras da árvore de decisão não podem ser usadas imediatamente e você
precisa interpretá-las antes de usá-las. No entanto, eles são claramente inteligíveis (e muito
melhores do que um vetor de coeficientes de valores).
As árvores de decisão têm mais variância do que viés em suas estimativas. Para ajustar menos
os dados, o exemplo especifica que a divisão mínima deve envolver pelo menos cinco
exemplos; também, poda a árvore. A poda acontece quando a árvore está totalmente crescida.
Partindo das folhas, o exemplo poda a árvore de galhos, apresentando pouca melhora na
redução do ganho de informação. Deixando inicialmente a árvore se expandir, os galhos
com pouca melhora são tolerados porque podem destravar galhos e folhas mais
interessantes. Refazer das folhas para a raiz e manter apenas os ramos que têm algum
valor preditivo reduz a variância do modelo, tornando as regras resultantes
parcimoniosas.
Para uma árvore de decisão, a poda é como o brainstorming. Primeiro, o código gera todas as
ramificações possíveis da árvore (como acontece com as ideias em uma sessão de brainstorming). Em
segundo lugar, quando o brainstorming termina, o código mantém apenas o que realmente funciona.
Capítulo11
Melhorando a IA com
Aprendizado Profundo
N
jornais, revistas de negócios, redes sociais e publicações não técnicas
todos os sites estão dizendo a mesma coisa: IA é uma coisa legal e vai revolucionar o mundo
por causa do aprendizado profundo. A IA é um campo muito maior do que o aprendizado de
máquina, e o aprendizado profundo é apenas uma pequena parte do aprendizado de máquina.
É importante distinguir o hype usado para atrair investidores e mostrar o que essa
tecnologia pode realmente fazer, que é o objetivo geral deste capítulo. O artigo
nohttps://blogs.nvidia.com/blog/2016/07/29/whats-difference-artificialintelligence-
machine-learning-deep-learning-ai/contém uma comparação útil
filho dos papéis dos três métodos de manipulação de dados (IA, aprendizado de máquina e
aprendizado profundo), que este capítulo descreve em detalhes.
Este capítulo ajuda você a entender o aprendizado profundo de um ponto de vista prático
e técnico e a entender o que ele pode alcançar no curto prazo, explorando suas
possibilidades e limitações. O capítulo começa com a história e os fundamentos das redes
neurais. Em seguida, apresenta os resultados de ponta de redes neurais convolucionais,
redes neurais recorrentes (ambas para aprendizado supervisionado) e redes adversárias
generativas (um tipo de aprendizado não supervisionado).
Apresentando o neurônio
O cérebro humano tem milhões de neurônios, que são células que recebem, processam e
transmitem sinais elétricos e químicos. Cada neurônio possui um núcleo com filamentos que
atuam como entradas,dendritosque recebem sinais de outros neurônios, e um único filamento
de saída, oaxônio,que termina com sinapses dedicadas à comunicação externa. Os neurônios
se conectam a outros neurônios e transmitem informações entre eles usando produtos
químicos, enquanto as informações dentro do próprio neurônio são processadas
eletricamente. Você pode ler mais sobre a estrutura neuronal emhttp://
www.dummies.com/education/science/biology/whats-the-basic-structure-
nervoso/ou emneurociência para leigos,por Frank Amthor.
O aprendizado profundo também aparece em muitas aplicações. Você encontra nas redes sociais em que
imagens e conteúdos são classificados automaticamente; nos motores de busca quando as consultas são
recuperadas; na publicidade online quando os consumidores são direcionados; em telefones celulares e
assistentes digitais para tarefas de fala, compreensão de linguagem ou tradução; em carros autônomos
para detecção de visão; e em um jogo Go da AlphaGo contra um campeão. Em aplicações menos
conhecidas, o aprendizado profundo também pode alimentar a robótica e as previsões de terremotos.
Você também pode encontrar aplicativos como o TinEye (https://tineye.com/) útil. Nesse caso, você
fornece uma imagem e o TinEye a encontra para você na Internet.
O perceptron era apenas uma maneira inteligente de traçar uma linha de separação em um espaço
simples feito pelos dados de entrada, conforme mostrado na Figura 11-1, na qual você tem dois
recursos (neste caso, o tamanho e o nível de domesticação de um animal) para distinguir
FIGURA 11-1:
Exemplo de um
perceptron em
simples e
desafiante
classificação
tarefas.
A Perceptron não realizou todas as expectativas de seu criador ou de seus financiadores. Logo
apresentou uma capacidade limitada, mesmo em sua especialização em reconhecimento de imagem. A
decepção geral desencadeou o primeiro inverno da IA e o abandono do conexionismo até a década
de 1980. No entanto, algumas pesquisas continuaram apesar da perda de financiamento (Dr. Nils J.
Nilsson, agora aposentado, mas ex-professor de IA de Stanford, conta mais sobre o progresso durante
esse período neste artigo:https://www.singularity
weblog.com/ai-is-so-hot-weve-forgotten-all-about-the-ai-winter/).
FIGURA 11-2:
Uma rede neural
arquitetura, de
entrada para saída.
A figura mostra uma arquitetura de rede neural simples. Observe como as camadas filtram e
processam as informações de forma progressiva. Isto é umentrada de alimentaçãoporque os dados
alimentam uma direção na rede. As conexões ligam exclusivamente as unidades em uma camada com
as unidades na camada seguinte (as informações fluem da esquerda para a direita).
Usar uma rede neural é como usar um sistema de filtragem estratificada para água: você
despeja a água por cima e a água é filtrada por baixo. A água não tem como voltar para
cima; Da mesma forma, as redes neurais forçam os recursos de dados a fluir pela rede e
se misturar uns com os outros conforme indicado pela arquitetura da rede. Ao usar a
melhor arquitetura para misturar recursos, a rede neural cria novos recursos compostos
em cada camada e ajuda a obter melhores previsões. Infelizmente, você não tem como
determinar a melhor arquitetura sem tentar empiricamente diferentes soluções e testar
se os dados de saída ajudam a prever seus valores de destino após o fluxo pela rede.
Cada camada sucessiva de unidades de rede neural processa progressivamente valores obtidos
de recursos, como em uma esteira rolante. À medida que a rede transmite os dados, eles
chegam a cada unidade como um valor somado produzido pelos valores presentes na camada
anterior e ponderado pelas conexões na camada atual. Quando os dados recebidos de outros
neurônios ultrapassam um determinado limite, a função de ativação aumenta o valor
armazenado na unidade; caso contrário, itextingue o sinal reduzindo-o. Após o processamento
da função de ativação, o resultado está pronto para avançar para a conexão da próxima
camada. Essas etapas se repetem em cada camada até que os valores cheguem ao fim e você
tenha um resultado.
O gradiente de desaparecimento ocorre quando você tenta transmitir um sinal por meio de uma
rede neural e o sinal desaparece rapidamente para valores zero; ele não consegue mais passar
pelas funções de ativação. Isso acontece porque as redes neurais são multiplicações
encadeadas. Cada multiplicação abaixo de zero diminui os valores rapidamente, e as funções de
ativação precisam de valores grandes o suficiente para deixar o sinal passar. Quanto mais
distantes as camadas de neurônios estiverem da saída, maior a probabilidade de serem
bloqueadas para atualizações porque os sinais são muito pequenos e as funções de ativação os
interromperão. Consequentemente, sua rede para de aprender como um todo ou aprende em
um ritmo incrivelmente lento.
As GPUs são poderosas unidades de computação de cálculo vetorial e de matriz necessárias para
retropropagação. Essas tecnologias tornam o treinamento de redes neurais alcançável em um tempo
mais curto e acessível a mais pessoas. A pesquisa também abriu um mundo de novas aplicações. As
redes neurais podem aprender com grandes quantidades de dados e tirar proveito de big data
(imagens, texto, transações e dados de mídia social), criando modelos que continuamente funcionam
melhor, dependendo do fluxo de dados que você os alimenta.
Grandes players como Google, Facebook, Microsoft e IBM identificaram a nova tendência
e, desde 2012, começaram a adquirir empresas e contratar especialistas (Hinton agora
trabalha com o Google; LeCun, o criador de Convolutional Neural Networks, lidera a
pesquisa de inteligência artificial do Facebook) nos novos campos do aprendizado
profundo. aprendendo com os vídeos do YouTube. A rede informática pode até
determinar por si só o que é um gato, sem qualquer intervenção humana (como pode ler
neste artigo daCom fiono
https://www.wired.com/2012/06/google-x-neural-network/).
Do jeito que as coisas estão agora, as pessoas têm uma ideia irreal de como o aprendizado
profundo pode ajudar a sociedade como um todo. Você vê um aplicativo de aprendizado profundo
vencer alguém no xadrez e pensa que, se ele pode fazer algo realmente incrível, que outras coisas
incríveis ele pode fazer? O problema é que mesmo seus proponentes não entendem muito bem o
aprendizado profundo. Em artigos técnicos sobre aprendizado profundo, o autor geralmente
descreve camadas de processamento nebuloso organizadas em uma rede sem qualquer tipo de
discurso sobre o que realmente acontece em cada uma dessas caixas. O ponto essencial a ser
lembrado é que o aprendizado profundo na verdade não entende nada. Ele usa um grande
número de exemplos para derivar correspondência de padrões com base estatística usando
princípios matemáticos. Quando uma IA ganha um jogo envolvendo um labirinto, ela não entende
o conceito de labirinto;
Em contraste com os humanos, o aprendizado profundo deve contar com um grande número de exemplos para
descobrir relações específicas entre entradas e saídas. Se você disser a uma criança que todos entre uma certa
idade sãoadolescente—nem uma criança nem um adolescente - a criança será capaz de reconhecer qualquer
pessoa que se encaixe na categoria de pré-adolescente com uma alta porcentagem de precisão, mesmo quando a
outra pessoa for um completo desconhecido. O aprendizado profundo exigiria treinamento especial para realizar
a mesma tarefa e seria fácil de enganar porque exemplos fora de sua experiência não seriam registrados.
Os humanos também podem criar hierarquias de conhecimento sem nenhum tipo de treinamento.
Sabemos, por exemplo, sem muito esforço que cães e gatos são ambos animais. Além disso, ao saber
que cães e gatos são animais, um ser humano pode facilmente dar o salto para ver outros animais
como animais, mesmo sem treinamento específico. O aprendizado profundo exigiria treinamento
separado para cada coisa que é um animal. Em suma, o aprendizado profundo não pode transferir o
que sabe para outras situações como os humanos.
Mesmo com essas limitações, o aprendizado profundo é uma ferramenta incrível, mas não deve ser a única
ferramenta na caixa de ferramentas da IA. Usar o aprendizado profundo para ver padrões onde os humanos não
conseguem é a maneira perfeita de aplicar essa tecnologia. Os padrões são uma parte essencial da descoberta de
coisas novas. Por exemplo, testes humanos de compostos para combater o câncer podem levar uma quantidade
imensa de tempo. Ao ver padrões onde os humanos não conseguem, o aprendizado profundo pode fazer
incursões sérias em direção a uma solução com muito menos esforço do que os humanos exigiriam.
Quando você olha para o aprendizado profundo, pode se surpreender ao encontrar muitas
tecnologias antigas, mas, surpreendentemente, tudo funciona como nunca antes. Como os
pesquisadores finalmente descobriram como fazer algumas soluções simples e antigas
funcionarem juntas, o big data pode filtrar, processar e transformar dados automaticamente.
Por exemplo, novas ativações como ReLU não são tão novas; eles são conhecidos desde o
perceptron. Além disso, as habilidades de reconhecimento de imagem que inicialmente
tornaram o aprendizado profundo tão popular não são novas. Inicialmente, o aprendizado
profundo alcançou grande impulso graças às Redes Neurais Convolucionais (CNN). Descoberto
na década de 1980 pelo cientista francês Yann LeCun (cuja página pessoal está emhttp://yann.
lecun.com/),essas redes agora trazem resultados surpreendentes porque usam muitas
camadas neurais e muitos dados. O mesmo vale para a tecnologia que permite que uma
máquina entenda a fala humana ou traduza de um idioma para outro; é uma tecnologia de
décadas que um pesquisador revisitou e começou a trabalhar no novo paradigma de
aprendizado profundo.
Obviamente, parte da diferença também é fornecida pelos dados (falaremos mais sobre isso
posteriormente), pelo aumento do uso de GPUs e pelas redes de computadores. Junto com
paralelismo (mais computadores colocados em clusters e operando em paralelo), as GPUs
permitem criar redes maiores e treiná-las com sucesso em mais dados. De fato, estima-se que
uma GPU execute determinadas operações 70 vezes mais rápido que qualquer CPU, permitindo
reduzir o tempo de treinamento de redes neurais de semanas para dias ou até horas.
Para obter mais informações sobre o quanto uma GPU pode capacitar o aprendizado de
máquina por meio do uso de uma rede neural, leia este artigo técnico sobre o tópico:
https://icml.cc/2009/papers/218.pdf.
As redes neurais são mais flexíveis do que outros algoritmos de aprendizado de máquina e podem
continuar treinando enquanto trabalham na produção de previsões e classificações. Essa capacidade
vem de algoritmos de otimização que permitem que as redes neurais aprendam, que podem funcionar
repetidamente em pequenas amostras de exemplos (chamadas aprendizado em lote) ou mesmo em
exemplos únicos (chamadosaprendizagem online). As redes de aprendizagem profunda podem
construir seu conhecimento passo a passo e ser receptivas a novas informações que possam chegar
(como a mente do bebê, que está sempre aberta a novos estímulos e experiências de aprendizado). Por
exemplo, um aplicativo de aprendizado profundo em um site de mídia social pode ser treinado em
imagens de gatos. Conforme as pessoas postam fotos de gatos, o aplicativo os reconhece e os marca
com um rótulo apropriado. Quando as pessoas começam a postar fotos de cachorros na rede social, a
rede neural não precisa começar o treinamento; ela também pode continuar aprendendo imagens de
cachorros. Esse recurso é particularmente útil para lidar com a variabilidade dos dados da Internet.
Uma rede de aprendizado profundo pode estar aberta a novidades e adaptar seus pesos para lidar
com elas.
A flexibilidade é útil mesmo quando uma rede conclui seu treinamento, mas você deve
reutilizá-la para fins diferentes do aprendizado inicial. Redes que distinguem objetos e os
classificam corretamente requerem muito tempo e muita capacidade computacional para
aprender o que fazer.aprendizagem de transferência).
Por exemplo, você pode transferir uma rede capaz de distinguir entre cães e gatos para
realizar um trabalho que envolve localizar pratos de macarrão com queijo. Você usa a
maioria das camadas da rede como elas são (você as congela) e depois trabalha nas
camadas finais de saída (afinação). Em pouco tempo, e com menos exemplos, a rede
aplicará ao macarrão com queijo o que aprendeu na distinção entre cães e gatos. Ele terá
um desempenho ainda melhor do que uma rede neural treinada apenas para reconhecer
macarrão com queijo.
Junto com muitas luzes vêm algumas sombras. As redes neurais precisam de grandes
quantidades de dados para funcionar, e os dados não são acessíveis a todos porque as
organizações maiores os mantêm. O aprendizado de transferência pode atenuar a falta de
dados, mas apenas parcialmente, porque certos aplicativos exigem dados reais.
Consequentemente, a democratização da IA é limitada. Além disso, os sistemas de aprendizado
profundo são tão complexos que seus resultados são difíceis de explicar (permitindo que o viés
e a discriminação floresçam) e frágeis porque truques podem enganar esses sistemas (consulte
https://www.dvhardware.net/article67588.htmlpara detalhes). Qualquer rede neural pode ser
sensível aataques adversários,que são manipulações de entrada concebidas para enganar o
sistema para dar uma resposta errada.
Por fim, o aprendizado profundo permiteaprendizagem de ponta a ponta,o que significa que ele
resolve problemas de maneira mais fácil e direta do que a solução anterior de aprendizado
profundo, o que pode resultar em um impacto maior na resolução de problemas. Você pode
querer resolver um problema difícil, como reconhecer rostos conhecidos ou dirigir um carro.
Usando a abordagem clássica de IA, você tinha que dividir o problema em subproblemas mais
gerenciáveis para alcançar um resultado aceitável em um tempo viável. Por exemplo, se você
deseja reconhecer rostos em uma foto, os sistemas de IA anteriores organizaram o problema
nestas partes:
reconhecimento de imagem.
CNNs não são uma ideia nova. Eles surgiram no final da década de 1980 como obra de
Yann LeCun (agora diretor de IA do Facebook) quando trabalhava na AT&T Labs-
Research, junto com Yoshua Bengio, Leon Bottou e Patrick Haffner em uma rede
chamada LeNet5. Você pode ver a rede emhttp://yann.lecun. com/exdb/lenet/ou neste
vídeo, em que o próprio LeCun mais jovem demonstra
estratifica a rede:https://www.youtube.com/watch?v=FwFduRA_L6Q.Em que
Na época, ter uma máquina capaz de decifrar números escritos à mão era uma façanha e tanto,
uma que ajudava o serviço postal a automatizar a detecção do CEP e a classificar as
correspondências recebidas e enviadas.
FIGURA 11-4:
uma convolução
digitalizando através
uma imagem.
Se você quiser saber mais sobre convoluções, pode conferir uma visualização criada por
alguns pesquisadores do Google Research e Google Brain. O
A visualização é do funcionamento interno de uma rede de 22 camadas desenvolvida por
cientistas do Google chamada GoogleLeNet (consulte o artigo emhttps://distill.
pub/2017/recurso-visualização/).No apêndice (https://distill. pub/2017/visualização
de recursos/apêndice/),eles mostram exemplos do
camadas atribuídas para detectar primeiro arestas, depois texturas, depois padrões completos, depois partes
e, finalmente, objetos inteiros.
Observar como as convoluções funcionam sugere que aprofundar o aprendizado profundo significa
que os dados passam por transformações mais profundas do que em qualquer algoritmo de
aprendizado de máquina ou em uma rede neural superficial. Quanto mais camadas, mais
transformações uma imagem sofre e mais profunda ela se torna.
O conjunto de dados resultante, concluído em 2009, foi chamado ImageNet e continha 3,2
milhões de imagens rotuladas, organizadas em 5.247 categorias organizadas hierarquicamente.
Você pode explorá-lo emhttp://www.image-net.org/ou leia o artigo original que
apresenta o conjunto de dados emhttp://www.image-net.org/papers/imagenet_cvpr09.
pdf.A ImageNet logo apareceu como uma competição de 2010, na qual as redes neurais
provaram sua capacidade de classificar corretamente imagens organizadas em 1.000 classes.
Se você alimentar um RNN com uma sequência de palavras, a rede aprenderá que, ao ver
uma palavra, precedida por outras palavras, ela pode determinar como completar a frase.
RNNs não são simplesmente uma tecnologia que pode automatizar a compilação de
entrada (como quando um navegador completa automaticamente os termos de pesquisa
conforme você digite palavras). Além disso, RNNs podem alimentar sequências e fornecer
uma tradução como saída, como o significado geral de uma frase (portanto, agora, a IA
pode eliminar a ambiguidade de frases em que as palavras são importantes) ou traduzir o
texto para outro idioma (novamente, a tradução funciona em contexto). Isso funciona até
mesmo com sons, porque é possível interpretar certas modulações de som como
palavras. RNNs permitem que computadores e telefones celulares entendam, com grande
precisão, não apenas o que você disse (é a mesma tecnologia que legenda
automaticamente), mas também o que você quis dizer,
Você tem uma IA fraca quando a IA mostra um comportamento inteligente, mas não é consciente como um ser
humano. Uma IA forte ocorre quando a IA pode realmente pensar como um ser humano.
O teste de Turing exige que um juiz humano interaja com dois sujeitos por meio de um
terminal de computador: um humano e uma máquina. O juiz avalia qual é uma IA com
base na conversa. Turing afirmou que se uma IA pode induzir um ser humano a pensar
que a conversa é com outro ser humano, é possível acreditar que a IA está no nível
humano da IA. (a IA deve ser como uma persona real, tanto no plano de fundo quanto na
atitude).
Desde a década de 1960, desafiar o teste de Turing tem se mostrado uma motivação para o
desenvolvimento de chatbots, que se baseiam na ideia demodelos baseados em recuperação.Ou seja,
o uso do Processamento de Linguagem Natural (NLP) processa a entrada de linguagem pelo
interrogador humano. Certas palavras ou conjuntos de palavras lembram respostas predefinidas e
feedback do armazenamento de memória do chatbot.
Joseph Weizenbaum construiu o primeiro chatbot desse tipo, ELIZA, em 1966 como uma
forma de terapeuta psicológico computadorizado. ELIZA foi feito de heurísticas simples,
que são frases básicas para se adaptar ao contexto e palavras-chave que acionaram ELIZA
para recordar uma resposta apropriada de um conjunto fixo de respostas. Você pode
tentar uma versão online de ELIZA emhttp://www.masswerk.at/elizabot/.Você pode se
surpreender ao ler conversas significativas como a produzida por ELIZA com sua
O Criador:http://www.masswerk.at/elizabot/eliza_test.html.
Dado o estado atual da arte na construção de chatbots, os RNNs funcionam muito bem
para trocas curtas, embora seja difícil obter resultados perfeitos para frases mais longas
ou mais articuladas. Se o escopo do discurso for limitado, esses sistemas podem fornecer
boas respostas, mas se degradam quando o contexto é aberto e geral porque precisariam
de um conhecimento comparável ao que um ser humano adquire ao longo da vida. (Os
humanos são bons conversadores com base na experiência e no conhecimento.)
Os dados para treinar um RNN são realmente a chave. Por exemplo, o Google Smart
Reply, um chatbot do Google, oferece respostas rápidas para e-mails.https://pesquisa.
googleblog.com/2015/11/computer-respond-to-this-email.htmlconta mais
sobre como esse sistema deve funcionar. No mundo real, ele tendia a responder à maioria
das conversas com “eu te amo” porque era treinado com exemplos tendenciosos.
Se você deseja conhecer o estado da arte no mundo dos chatbots, pode se manter atualizado
sobre as competições anuais de chatbots nas quais testes de Turing são aplicados à tecnologia
atual. Por exemplo, o prêmio Lobner é o mais famoso (http://www.
loebner.net/Prizef/loebner-prize.html)e o lugar certo para começar. No entanto
ainda incapaz de passar no teste de Turing, o mais recente vencedor do prêmio Lobner na
época da redação deste livro foi o Mitsuku, um software que pode raciocinar sobre objetos
específicos propostos durante o discurso; ele também pode jogar jogos e até mesmo
realizar truques de mágica (http://www.mitsuku.com/).
Para ver um GAN básico em ação (agora existem muitas variantes sofisticadas e mais estão sendo
desenvolvidas), você precisa de um conjunto de dados de referência, geralmente consistindo de dados
do mundo real, cujos exemplos você gostaria de usar para ensinar a rede GAN. Por exemplo, se você
tiver um conjunto de dados de imagem de cachorro, espera que o GAN aprenda a aparência de um
cachorro a partir do conjunto de dados. Depois de aprender sobre cães, o GAN pode propor imagens
plausíveis e realistas de cães que são diferentes daquelas do conjunto de dados inicial. (Elas serão
novas imagens; simplesmente replicar imagens existentes é considerado um erro de um GAN.)
O conjunto de dados é o ponto de partida. Você também precisa de duas redes neurais,
cada uma especializada em uma tarefa diferente e ambas competindo uma com a outra.
Uma rede é chamada degeradore recebe uma entrada arbitrária (por exemplo, uma
sequência de números aleatórios) e gera uma saída (por exemplo, a imagem de um
cachorro), que é umartefatoporque é artificialmente criado usando a rede do gerador. A
segunda rede é adiscriminador,que deve distinguir corretamente os produtos do gerador,
os artefatos, dos exemplos no conjunto de dados de treinamento.
Quando uma GAN começa a treinar, ambas as redes tentam melhorar usando
backpropagation, com base nos resultados do discriminador. Os erros que o
discriminador comete ao distinguir uma imagem real de um artefato se propagam para o
discriminador (como em uma rede neural de classificação). ). A Figura 11-5 mostra essa
relação.
As imagens originais escolhidas por Goodfellow para explicar como funciona um GAN são as do
falsificador de arte e do investigador. O investigador se torna hábil em detectar arte falsificada,
mas o falsificador também se aprimora para evitar a detecção pelo investigador.
Você pode se perguntar como o gerador aprende a criar os artefatos certos se nunca vê
um original. Somente o discriminador vê o conjunto de dados original quando tenta
distinguir a arte real dos artefatos geradores. Mesmo que o gerador nunca examine nada
do conjunto de dados original, ele recebe dicas por meio do trabalho do discriminador.
São dicas leves, guiadas por muitas tentativas malsucedidas no início do gerador.
»Modificando imagens existentes aplicando resolução mais alta, adicionando imagens especiais
padrões (por exemplo, transformar um cavalo em uma zebra:https://junyanz. github.io/
CycleGAN/),e preencher as partes que faltam (por exemplo, você deseja remover uma
pessoa de uma foto e um GAN substitui a lacuna por algum plano de fundo plausível,
como nesta arquitetura neural de conclusão de imagem:
http://hi.cs.waseda.ac.jp/~iizuka/projects/completion/en/)
Capítulo12
Desenvolvendo robôs
P
As pessoas costumam confundir robótica com IA, mas a robótica é diferente da IA.
A inteligência artificial visa encontrar soluções para alguns problemas difíceis
relacionados às habilidades humanas (como reconhecer objetos ou compreender
fala ou texto); A robótica visa utilizar máquinas para realizar tarefas no mundo físico de
forma parcial ou totalmente automatizada. Ajuda pensar na IA como o software usado
para resolver problemas e na robótica como o hardware para tornar essas soluções uma
realidade.
O hardware robótico pode ou não ser executado usando o software AI. Os humanos controlam
remotamente alguns robôs, como no caso do robô da Vinci, discutido na seção “Assistência a um
cirurgião” do Capítulo 7. Em muitos casos, a IA fornece aprimoramento, mas o humano ainda está no
controle. Entre esses extremos estão os robôs que recebem ordens abstratas de humanos (como ir do
ponto A ao ponto B em um mapa ou pegar um objeto) e dependem da IA para executar as ordens.
Outros robôs executam tarefas atribuídas de forma autônoma, sem qualquer intervenção humana. A
integração da IA em um robô torna o robô mais inteligente e útil na execução de tarefas, mas os
robôs nem sempre precisam da IA para funcionar corretamente. A imaginação humana fez com que
os dois se sobrepusessem como resultado de filmes e romances de ficção científica.
Este capítulo explora como essa sobreposição aconteceu e distingue entre as realidades
atuais dos robôs e como o uso extensivo de soluções de IA pode transformá-los. Os robôs
existem na produção desde 1960. Este capítulo também explora como as pessoas estão
empregando robôs cada vez mais no trabalho industrial, na descoberta científica, na
assistência médica e na guerra. Descobertas recentes de IA estão acelerando esse
processo porque resolvem problemas difíceis em robôs, como reconhecer
Os robôs são uma ideia relativamente recente. A palavra vem da palavra tchecarobô, o
que significa trabalho forçado. O termo apareceu pela primeira vez na peça de 1920
Robôs Universais de Rossum,escrito pelo autor tcheco Karel Čapek. No entanto, a
humanidade há muito sonha com seres mecânicos. Os antigos gregos desenvolveram um
mito de um homem mecânico de bronze, Talus, construído pelo deus da metalurgia,
Hefesto, a pedido de Zeus, o pai dos deuses. Os mitos gregos também contêm
referências a Hefesto construindo outros autômatos, além de Talus.Autômatossão
máquinas auto-operadas que executam sequências específicas e predeterminadas de
tarefas (ao contrário dos robôs, que têm flexibilidade para realizar uma ampla gama de
tarefas). Os gregos realmente construíram autômatos hidráulicos que funcionavam da
mesma forma que um algoritmo executado no mundo físico. Como algoritmos, os
autômatos incorporam a inteligência de seu criador, dando assim a ilusão de serem
máquinas de raciocínio autoconscientes.
Os robôs descritos por Čapek não eram exatamente autômatos mecânicos, mas sim seres vivos
projetados e montados como se fossem autômatos. Seus robôs possuíam uma forma semelhante à
humana e desempenhavam funções específicas na sociedade destinadas a substituir os trabalhadores
humanos. Reminiscentes do Frankenstein de Mary Shelley, os robôs de Čapek eram algo que as
pessoas viam comoandróideshoje: seres artificiais criados por bioengenharia, conforme descrito no
romance de Philip K. DickSerá que os Andróides sonham com ovelhas elétricas?
Čapek criou tanto a ideia de robôs quanto a de um apocalipse robótico, como a aquisição
da IA que você vê nos filmes de ficção científica e que, devido ao progresso recente da
IA, é temida por figuras notáveis como o fundador da Microsoft, Bill Gates, o físico
Stephen Hawking, e o inventor e empresário Elon Musk. Os escravos robóticos de Čapek
se rebelam contra os humanos que os criaram no final da peça, eliminando quase toda a
humanidade.
Asimov cunhou o termorobóticae usou no mesmo sentido que as pessoas usam o termomecânica.Sua
poderosa imaginação ainda hoje define o padrão para as expectativas das pessoas em relação aos
robôs. Asimov colocou os robôs em uma era de exploração espacial, fazendo-os usar seus cérebros
positrônicos para ajudar os humanos diariamente a realizar tarefas comuns e extraordinárias. A
cérebro positrônicoé um dispositivo fictício que faz com que os robôs dos romances de Asimov atuem
de forma autônoma e sejam capazes de auxiliar ou substituir humanos em diversas tarefas. Além de
fornecer capacidades semelhantes às humanas na compreensão
1.Um robô não pode ferir um ser humano ou, por omissão, permitir que um ser
humano sofra algum mal.
2.Um robô deve obedecer às ordens dadas por seres humanos, exceto quando tais ordens
entrarem em conflito com a Primeira Lei.
3.Um robô deve proteger sua própria existência desde que tal proteção não entre em
conflito com a Primeira ou Segunda Leis.
Mais tarde o autor acrescentou uma regra zero, com maior prioridade sobre as demais, a fim de
assegurar que um robô agisse para favorecer a segurança de muitos:
0. Um robô não pode prejudicar a humanidade ou, por inação, permitir que a humanidade seja
prejudicada.
No centro de todas as histórias de Asimov sobre robôs, as três leis permitem que os robôs
trabalhem com humanos sem qualquer risco de rebelião ou apocalipse da IA. Impossíveis de
ignorar ou modificar, as três leis são executadas em ordem de prioridade e aparecem como
formulações matemáticas nas funções positrônicas do cérebro. Infelizmente, as leis têm
problemas de brechas e ambiguidades, de onde surgem as tramas da maioria de seus
romances. As três leis vêm de uma ficçãomanual de robótica,56ª Edição, 2058 AD e contam com
princípios de inofensividade, obediência e auto-sobrevivência.
Asimov imaginou um universo no qual você pode reduzir o mundo moral a alguns princípios
simples, com alguns riscos que conduzem muitos dos enredos de sua história. Na realidade,
Asimov acreditava que os robôs são ferramentas e que as três leis poderiam funcionar mesmo
no mundo real para controlar seu uso (leia esta entrevista de 1981 emCalcular!revista
para detalhes:https://archive.org/stream/1981-11-compute-magazine/Compute_
Issue_018_1981_Nov#page/n19/mode/2up).Desafiando a visão otimista de Asimov,
no entanto, os robôs atuais não têm a capacidade de:
Alguns podem pensar que os robôs de hoje realmente não são muito inteligentes porque
não possuem essas capacidades e estariam certos. No entanto, o Conselho de Pesquisa
em Engenharia e Ciências Físicas (EPSRC), que é a principal agência de financiamento de
pesquisas em engenharia e ciências físicas do Reino Unido, promoveu a revisão das leis
de robótica de Asimov em 2010 para uso com robôs reais, dada a tecnologia atual. O
resultado é muito diferente das declarações originais de Asimov
Os princípios do EPSRC oferecem um ponto de vista mais realista sobre robôs e moralidade,
considerando a tecnologia de IA fraca em uso agora, mas também podem fornecer uma
solução parcial em cenários de tecnologia avançada. O Capítulo 14 discute problemas
relacionados ao uso de carros autônomos, uma espécie de robô móvel que dirige para você.
Por exemplo, na exploração doproblema do carrinhonesse capítulo,você enfrenta problemas
morais possíveis, mas improváveis, que desafiam a confiança em máquinas automatizadas
quando é hora de fazer certas escolhas.
A categoria mais frequente de robôs é o braço do robô, como o Unimate descrito anteriormente. Os
robôs desta categoria também são chamadosmanipuladores.Você pode encontrá-los em fábricas,
trabalhando como robôs industriais, onde eles montam e soldam em uma velocidade e precisão
inigualáveis por trabalhadores humanos. Alguns manipuladores também aparecem em hospitais
para auxiliar em operações cirúrgicas. Os manipuladores têm uma amplitude de movimento limitada
porque se integram na sua localização (podem mover-se um pouco, mas não muito porque carecem
de motores potentes ou requerem uma ligação elétrica), pelo que necessitam da ajuda de técnicos
especializados para se deslocarem para um nova localização. Além disso, os manipuladores usados
para a produção tendem a ser totalmente automatizados (em contraste com os dispositivos cirúrgicos,
que são controlados remotamente, dependendo do cirurgião para tomar decisões sobre a operação
médica). Mais de um milhão de manipuladores aparecem em todo o mundo, metade deles localizados
no Japão.
Um vídeo fornecido pelo IEEE Spectrum dá uma ideia melhor de como o simples ato de
caminhar pode ser desafiador. O vídeo mostra os robôs envolvidos no DARPA Robotics
Challenge (DRC), desafio realizado pelo US Defense Advanced Research Projects
Agência de 2012 a 2015:https://www.youtube.com/watch?v=g0TaYhjpOfo.O
O objetivo do DRC é explorar os avanços robóticos que podem melhorar as operações
humanitárias e de desastres em ambientes perigosos para os seres humanos (https://
www.darpa.mil/program/darpa-robotics-challenge).Por esta razão, você vê
robôs andando em diferentes terrenos, abrindo portas, agarrando ferramentas como uma furadeira
elétrica ou tentando operar uma roda de válvula. Um robô desenvolvido recentemente chamado Atlas,
da Boston Dynamics, mostra-se promissor, conforme descrito neste artigo:https://www.
theverge.com/circuitbreaker/2017/11/17/16671328/boston-dynamics-backflip-
robô-atlas.O robô Atlas é realmente excepcional, mas ainda tem um longo caminho a percorrer.
Um robô com rodas pode se mover facilmente nas estradas, mas em certas situações, você precisa de
um robô com forma humana para atender a necessidades específicas. A maioria das infra-estruturas
do mundo são feitas para um homem ou uma mulher navegar. A presença de obstáculos, como o
tamanho da passagem ou a presença de portas ou escadas, dificulta o uso de robôs de formatos
diferentes. Por exemplo, durante uma emergência, um robô pode precisar entrar em um
FIGURA 12-1:
o estranho
vale.
Várias hipóteses foram formuladas sobre os motivos da repulsa que os humanos sentem
ao lidar com um robô que é quase, mas não completamente, humano. As pistas que os
humanos usam para detectar robôs são o tom da voz robótica, a rigidez do movimento e
a textura artificial da pele do robô. Alguns cientistas atribuem o vale misterioso a razões
culturais, outros a razões psicológicas ou biológicas. Um experimento recente com
macacos descobriu que os primatas podem passar por uma experiência semelhante
quando expostos a fotos de macacos processadas de forma mais ou menos realista,
renderizadas pela tecnologia 3-D (veja a história aqui:https://www.wired. com/2009/10/
uncanny-monkey/).Macacos participando do experimento exibidos
Cuidando de você
Desde 1983, os robôs auxiliam os cirurgiões em operações difíceis, fornecendo cortes precisos
e precisos que somente os braços robóticos podem fornecer. Além de oferecer controle remoto
das operações (mantendo o cirurgião fora da sala de cirurgia para criar um
Prestação de serviços
Os robôs fornecem outros serviços de cuidado, tanto em espaços públicos quanto privados. O
robô interior mais famoso é o aspirador Roomba, um robô que vai aspirar sozinho o chão da
sua casa (é um best-seller robótico, tendo ultrapassado os 3 milhões de unidades vendidas),
mas também existem outros robôs de serviço a considerar:
»Cortar a relva:Existe uma incrível variedade de robôs cortadores de grama; você pode
encontre alguns em sua loja de jardinagem local.
»Cuidados com idosos:Um exemplo de robô que atende idosos é o Hector, financiado pela
a União Europeia (https://www.forbes.com/sites/jenniferhicks/
2012/08/13/hector-robotic-assistance-for-the-elderly/
# 5063a3212443).
Robôs assistivos para idosos estão longe de oferecer assistência geral como uma enfermeira de
verdade. Os robôs se concentram em tarefas críticas, como lembrar de medicamentos, ajudar
os pacientes a passar de uma cama para uma cadeira de rodas, verificar as condições físicas do
paciente, disparar um alarme quando algo está errado ou simplesmente agir como um
acompanhante. Por exemplo, o robô terapêutico Paro oferece terapia animal a idosos com
deficiência, como você pode ler neste artigo emhttps://www.huffingtonpost.com/
the-conversation-global/robot-revolution-why-tech_b_14559396.html.
Os robôs são empregados até mesmo onde os humanos definitivamente morrerão, como em
desastres nucleares como Three Mile Island, Chernobyl e Fukushima. Esses robôs removem
materiais radioativos e tornam a área mais segura. A radiação de alta dose afeta até os robôs
porque a radiação causa ruído eletrônico e picos de sinal que danificam os circuitos ao longo do
tempo. Apenascomponentes eletrônicos endurecidos por radiaçãopermitem que os robôs
resistam aos efeitos da radiação o suficiente para realizar seu trabalho, como o Little Sunfish,
um robô subaquático que opera em um dos reatores inundados de Fukushima onde ocorreu o
colapso (conforme descrito neste artigo emhttp://www.bbc.
com/news/in-pictures-40298569).
Além disso, cenas de guerra ou crimes representam situações de risco de vida nas quais
os robôs são frequentemente usados para transportar armas ou desarmar bombas.
Esses robôs também podem investigar pacotes que podem incluir muitas coisas
prejudiciais além de bombas. Modelos de robôs como o PackBot da iRobot (da mesma
empresa que fabrica Rumba, o limpador doméstico) ou o Talon da QinetiQ North America
manipulam explosivos perigosos por controle remoto, o que significa que um especialista
em explosivos controla suas ações à distância. Alguns robôs podem até atuar no lugar de
soldados ou policiais em tarefas de reconhecimento ou intervenções diretas (por
exemplo, a polícia de Dallas usou um robô para eliminar um atiradorhttp://edition.cnn.
com/2016/07/09/opinions/dallas-robot-questions-singer/index.html).
As pessoas esperam que os militares usem cada vez mais robôs no futuro. Além das
considerações éticas dessas novas armas, é uma questão de velhas armas versus
modelo de manteiga (https://www.huffingtonpost.com/jonathan-tasini/guns-versus-
manteiga-nossa-re_b_60150.html),significando que uma nação pode trocar poder econômico
por poder militar. Os robôs parecem um ajuste perfeito para esse modelo, mais do que o
armamento tradicional que precisa de pessoal treinado para operar. Usar robôs significa que
um país pode traduzir sua produção em um exército de robôs imediatamente eficaz a qualquer
momento, algo que oGuerra das Estrelasprequelas demonstram tudo muito bem.
As pessoas há muito fantasiam sobre carros que podem dirigir sozinhos. Esses carros
estão rapidamente se tornando realidade após as conquistas no DARPA Grand Challenge.
A maioria dos fabricantes de automóveis percebeu que ser capaz de produzir e
Considerando os componentes
O propósito de um robô é agir no mundo, então ele precisaefetores,que são pernas móveis ou
rodas que fornecem ocapacidade de locomoção. Ele também precisa de braços e pinças para
segurar, girar, transladar (modificar a orientação fora da rotação) e, assim, fornecer
capacidades de manipulação.Ao falar sobre a capacidade do robô de fazer algo, você também
pode ouvir o termoatuador dousados de forma intercambiável com efetores. Um atuador é
um dos mecanismos que compõem os efetores, permitindo um único movimento. Assim, uma
perna de robô possui diferentes atuadores, como motores elétricos ou cilindros hidráulicos que
realizam movimentos como orientar os pés ou dobrar o joelho.
sentindo o mundo
O Capítulo 14 discute os sensores em detalhes e apresenta aplicações práticas para
ajudar a explicar os carros autônomos. Existem muitos tipos de sensores, alguns focando
no mundo externo e outros no próprio robô. Por exemplo, um braço robótico precisa
saber quanto seu braço estendeu ou se atingiu seu limite de extensão. Além disso, alguns
sensores são ativos (buscam informações ativamente com base em uma decisão do
robô), enquanto outros são passivos (recebem as informações constantemente). Cada
sensor fornece uma entrada eletrônica que o robô pode usar ou processar
imediatamente para obter uma percepção.
Controlando um robô
Após a detecção fornecer todas as informações necessárias, o planejamento fornece ao robô a
lista das ações corretas a serem executadas para atingir seus objetivos. O planejamento é feito
programaticamente (usando um sistema especialista, por exemplo, conforme descrito no
Capítulo 3) ou usando um algoritmo de aprendizado de máquina, como redes bayesianas,
conforme descrito no Capítulo 10. Os desenvolvedores estão experimentando o uso de
aprendizado por reforço (machine leaning based na tentativa e erro), mas um robô não é uma
criança (que também depende de tentativa e erro para aprender a andar); a experimentação
pode ser ineficiente, frustrante e cara na criação automática de um plano porque o robô pode
ser danificado no processo.
Finalmente, o planejamento não é apenas uma questão de algoritmos inteligentes, porque quando se
trata de execução, é provável que as coisas não saiam conforme o planejado. Pense sobre esta
questão de uma perspectiva humana. Quando você está com os olhos vendados, mesmo que queira ir
direto à sua frente, não o fará, a menos que tenha uma fonte constante de correções. O resultado é
que você começa a fazer loops. Suas pernas, que são os atuadores, nem sempre executam
perfeitamente as instruções. Os robôs enfrentam o mesmo problema. Além disso, os robôs enfrentam
problemas como atrasos no sistema (tecnicamente chamadolatência) ou o robô não executa as
instruções exatamente no tempo, bagunçando as coisas. No entanto, na maioria das vezes, o
problema é um problema com o ambiente do robô, de uma das seguintes maneiras:
»Incerteza:O robô não tem certeza de onde está, ou pode observar parcialmente o
situação, mas não consegue descobrir exatamente. Por causa da incerteza, os desenvolvedores
dizem que o robô opera em umambiente estocástico.
»Reconhecer os regulamentos e
limitações da operabilidade do drone
Capítulo13
Voar com drones
D
rones são robôs móveis que se movem no ambiente voando. Inicialmente
conectados à guerra, os drones se tornaram uma poderosa inovação para lazer,
exploração, entrega comercial e muito mais. No entanto, o desenvolvimento
militar ainda se esconde por trás dos desenvolvimentos e causa preocupação de muitos
especialistas em IA e figuras públicas que os prevêem como máquinas de matar
possivelmente imparáveis.
Voar é algo que as pessoas fazem desde que os irmãos Wright voaram pela primeira vez.
17 de dezembro de 1903 (verhttps://www.nps.gov/wrbr/learn/historyculture/
thefirstflight.htm).No entanto, os humanos sempre quiseram voar, e pensadores
lendários como Leonardo da Vinci, um gênio da Renascença (mais podem ser
descobertos lendo este artigo do Smithsonian Museum:https://airandspace.
si.edu/stories/editorial/leonardo-da-vinci-and-flight)colocar suas mentes
à tarefa. A tecnologia de voo é avançada, então os drones são mais maduros do que outros
robôs móveis porque a tecnologia chave para fazê-los funcionar é bem compreendida. A
fronteira dos drones é incorporar IA. Mover-se voando impõe alguns limites importantes sobre
o que os drones podem alcançar, como o peso que podem carregar ou as ações que podem
realizar ao chegar a um destino.
Este capítulo discute o estado atual dos drones: consumidor, comercial e militar. Ele
também explora os papéis que os drones podem desempenhar no futuro. Essas funções
para drones dependem em parte da integração com soluções de IA, o que lhes dará mais
autonomia e recursos estendidos em movimento e operação.
Os drones militares têm uma longa história. O momento exato em que eles começaram é um tópico para muitos debates, mas a
Marinha Real começou a usar aviões semelhantes a drones para prática de tiro ao alvo na década de 1930 (consulte
https://dronewars.net/2014/10/06/rise-of-the-reapers-a-brief-
história-dos-drones/para detalhes). Os EUA usaram drones reais regularmente desde
1945 para alvos (verhttp://www.designation-systems.net/dusrm/m-33.html
para detalhes). A partir de 1971, os pesquisadores começaram a aplicar drones amadores
para fins militares. John Stuart Foster, Jr., um físico nuclear que trabalhou para o governo
dos EUA, era apaixonado por aeromodelos e teve a ideia de adicionar
As pessoas debatem se devem dar capacidades de IA aos drones militares. Alguns acham
que isso significaria que os drones poderiam trazer destruição e matar pessoas por meio
de seu próprio processo de tomada de decisão. No entanto, os recursos de IA também
podem permitir que os drones evitem mais facilmente a destruição ou executem outras
tarefas não destrutivas, assim como a IA ajuda a guiar os carros hoje. Ele poderia até
mesmo estabilizar os movimentos de um piloto em clima severo, semelhante à forma
como o sistema da Vinci funciona para cirurgiões (consulte a seção “Assistência a um
cirurgião” do Capítulo 7 para obter detalhes). Atualmente, os drones militares com
capacidade de matar também são controversos porque a IA tenderia a tornar o ato de
guerra abstrato e ainda mais desumanizador, reduzindo-o a imagens transmitidas por
drones aos seus operadores e a comandos emitidos remotamente. Sim, o operador ainda
tomaria a decisão de matar,
As discussões sobre drones militares são essenciais neste capítulo porque se interconectam
com o desenvolvimento de drones civis e influenciam grande parte da discussão atual sobre
essa tecnologia por meio da opinião pública. Além disso, dar total autonomia aos drones
militares inspira histórias sobre um apocalipse de IA que surgiu fora do campo da ficção
científica e se tornou uma preocupação para o público. Para uma visão geral técnica mais
detalhada dos modelos e capacidades, consulte este artigo da Deutsche Welle:
http://www.dw.com/en/a-guide-to-military-drones/a-39441185.
Conhecendo o quadricóptero
Muitas pessoas ouviram pela primeira vez sobre drones quadricópteros de consumo e hobby, e
depois sobre drones quadricópteros comerciais (como o empregado pela Amazon que é
discutido emhttps://www.amazon.com/Amazon-Prime-Air/b?node=8037720011)
através da revolução do telefone móvel. A maioria dos drones militares não são da variedade de
helicópteros hoje, mas você pode encontrar alguns, como o drone TIKAD da Duke University descrito
nohttp://www.defenseone.com/technology/2017/07/israeli-military-buyingcopter-
drones-machine-guns/139199/e demonstrado emhttps://www.you
tube.com/watch?v=VaTW8uAo_6s.Os drones helicópteros militares na verdade começaram como
No entanto, os telefones celulares foram essenciais para fazer todo esse trabalho. À medida que os telefones
celulares ficaram menores, suas baterias também se tornaram menores e mais leves. Os telefones celulares
também carregam câmeras miniaturizadas e conectividade sem fio – todos os recursos necessários em um
drone contemporâneo. Algumas décadas atrás, pequenos drones tinham uma série de limitações:
Graças a todas essas melhorias, os drones deixaram de ser modelos de asas fixas,
semelhantes a aviões, para algo semelhante a helicópteros, mas usando vários rotores
para se erguer no ar e tomar uma direção. O uso de vários rotores cria uma vantagem.
Ao contrário dos helicópteros, os drones não precisam de rotores de passo variável para
orientação. Os rotores de passo variável são mais caros e difíceis de controlar. Em vez
disso, os drones usam hélices simples de passo fixo, que podem emular, como um
conjunto, as mesmas funções dos rotores de passo variável. Consequentemente, agora
você vê drones multirotores: tricopter, quadcopter, hexacopter e octocopter,
respectivamente com 3, 4, 6 ou 8 rotores para usar. Entre as diferentes configurações
possíveis, o quadcopter levou a melhor e se tornou a configuração de drone mais popular
para uso comercial e civil.
Além dos usos desonestos de drones pequenos, mas baratos e facilmente personalizáveis por
insurgentes e grupos terroristas (por exemplo, consultehttp://www.popularmechanics.
com/military/weapons/a18577/isis-packing-drones-with-explosives/),
os governos estão cada vez mais interessados em drones menores para combate urbano e
interno. Locais internos, como corredores ou salas, são onde as capacidades de intervenção
dos drones militares Predator e Reaper do tamanho de uma aeronave são limitadas (a menos
que você precise derrubar o prédio inteiro). O mesmo vale para drones de reconhecimento,
como Ravens e Pumas, porque esses drones são feitos para operações em campo de batalha
aberto, não para guerra interna. (Você pode ler uma análise detalhada desta possível evolução
militar de drones de consumo inofensivos neste artigo de
Com fio:https://www.wired.com/2017/01/military-may-soon-buy-drones-home/.)
Os drones comerciais estão longe de serem empregados imediatamente das prateleiras das
lojas para o campo de batalha, embora ofereçam a plataforma certa para os militares
desenvolverem várias tecnologias usando-os. Uma razão importante para os militares usarem
drones comerciais é que os produtos de prateleira são em sua maioria baratos em comparação
com o armamento padrão, tornando-os facilmente descartáveis e utilizáveis em enxames que
compreendem um grande número deles. Fáceis de hackear e modificar, eles exigem mais
proteção do que seus colegas militares já endurecidos (suas comunicações e controles podem
ser bloqueados eletronicamente) e precisam da integração de algumas partes importantes de
software e hardware antes de serem efetivamente implantados em qualquer missão.
»Entregar mercadorias em tempo hábil, não importa o tráfego (em desenvolvimento por
Google X, Amazon e muitas startups)
Ter mercadorias entregues por drone é algo que chamou a atenção do público desde
cedo, graças à promoção de grandes empresas. Um dos primeiros e mais reconhecidos
inovadores é a Amazon (que promete que um serviço, Amazon Prime Air,
entrará em operação em breve:https://www.amazon.com/Amazon-Prime-Air/
b?node=8037720011).Google promete serviço semelhante com seu Project Wing
(http://www.businessinsider.com/project-wing-update-future-googledrone-delivery-
project-2017-6?IR=T).No entanto, ainda podemos estar a anos de distância
de ter um sistema de entrega aérea viável e escalável baseado em drones.
Os drones podem se tornar seus olhos, proporcionando visão em situações muito caras, perigosas ou
difíceis de enxergar sozinho. Controlados remotamente ou semiautônomos (usando soluções de IA
para detecção de imagem ou processamento de dados de sensores), os drones podem monitorar,
manter, vigiar ou buscar e resgatar porque podem visualizar qualquer infraestrutura de cima e
acompanhar e apoiar operadores humanos sob demanda em suas atividades. Por exemplo, os drones
inspecionaram com sucesso linhas de energia, oleodutos (https://
www.wsj.com/articles/utilities-turn-to-drones-to-inspect-power-linesand-
pipelines-1430881491),e infraestruturas ferroviárias (http://fortune.com/
2015/05/29/bnsf-drone-program/),permitindo uma monitorização mais frequente e menos
dispendiosa de infraestruturas vitais, mas de difícil acesso. Mesmo as companhias de seguros
os consideram úteis para avaliações de danos (https://www.wsj.com/articles/
seguradoras-são-configuradas para usar-drones-para-avaliar-harveys-
propertydamage-1504115552).
Forças policiais e socorristas em todo o mundo consideram os drones úteis para uma variedade de atividades,
desde operações de busca e salvamento até detecção e localização de incêndios florestais, e desde missões de
patrulha de fronteira até monitoramento de multidões. A polícia está encontrando
novas formas de usar drones (http://www.foxnews.com/tech/2017/07/19/
dronesbecome-newest-crime-fighting-tool-for-police.html),incluindo encontrar
infratores de trânsito (veja o artigo emhttp://www.interdrone.com/news/french-
policeus-drones-to-catch-traffic-violators).
A agricultura é outra área importante em que os drones estão revolucionando o trabalho. Eles não
apenas podem monitorar as plantações, relatar o progresso e detectar problemas, mas também
aplicar pesticidas ou fertilizantes somente onde e quando necessário, conforme descrito por
Revisão de Tecnologia do MIT (https://www.technologyreview.com/s/526491/
drones agrícolas/).Os drones oferecem imagens mais detalhadas e menos onerosas que
as de um satélite orbital, podendo ser empregados rotineiramente para
Os drones podem realizar feitos ainda mais incríveis. A ideia é mover a infraestrutura
existente para o céu usando drones. Por exemplo, o Facebook pretende fornecer
Conexões de Internet (https://www.theguardian.com/technology/2017/jul/ 02/
facebook-drone-aquila-internet-test-flight-arizona)onde comu-
o cabo de nicação não chegou ou está danificado usando drones Aquila especiais
(https://www.facebook.com/notes/mark-zuckerberg/the-technologybehind-aquila/
10153916136506634/).Existe também um plano para usar drones para
transportar pessoas, substituindo meios de transporte comuns como o carro
(http://www.bbc.com/news/technology-41399406).Outra possibilidade é
produzir eletricidade no alto, onde os ventos são mais fortes e ninguém vai protestar contra
ruído do rotor (https://www.bloomberg.com/news/articles/2017-04-11/flyingdrones-
that-generate-power-from-wind-get-backing-from-eon).
As empresas esperam a execução autônoma de tarefas para drones comerciais, por exemplo,
tornando-os capazes de entregar uma encomenda do armazém ao cliente e lidar com qualquer
problema ao longo do caminho. (Tal como acontece com os robôs, algo sempre dá errado que
o dispositivo deve resolver usando IA no local.) Pesquisadores do Laboratório de Propulsão a
Jato da NASA em Pasadena, Califórnia, testaram recentemente o voo automatizado de um
drone contra um piloto de drone profissional altamente qualificado (consultehttps://www.
nasa.gov/feature/jpl/drone-race-human-versus-artificial-intelligence
para detalhes). Curiosamente, o piloto humano teve vantagem neste teste até ficar cansado,
ponto em que os drones mais lentos, mais estáveis e menos propensos a erros o alcançaram.
No futuro, você pode esperar o mesmo que aconteceu com os jogos de xadrez e Go: os drones
automatizados ultrapassarão os humanos como pilotos de drones em termos de habilidades de
vôo e resistência.
Quando o empresário Elon Musk, o cofundador da Apple Steve Wozniak, o físico Stephen
Hawking e muitas outras figuras públicas notáveis e pesquisadores de IA deram o alarme
sobre os recentes desenvolvimentos de armas de IA, eles não pensaram nos robôs mostrados
em filmes comoExterminador do FuturoouEu Robô,mas sim de drones voadores armados e
outras armas automatizadas. As armas autônomas podem iniciar uma corrida armamentista e
mudar para sempre a face da guerra. Você pode descobrir mais sobre este tópico emhttp://
mashable.com/2017/08/20/ai-weapons-ban-open-letter-un/.
No filmeJogos de guerra(https://www.amazon.com/exec/obidos/ASIN/
B0089J2818/datacservip0f-20/),o computador War Operation Plan Response (WOPR) contém
uma IA forte capaz de determinar o melhor curso de ação para responder a uma ameaça. Durante
a parte inicial do filme, WOPR deixa de ser apenas um conselheiro para se tornar o executor da
política. Então chega um hacker que quer jogar um jogo: guerra termonuclear. Infelizmente,
WOPR assume que todos os jogos são reais e realmente começa a criar um plano para se envolver
em uma guerra termonuclear com a União Soviética. O filme parece estar prestes a confirmar
todos os piores medos que possam existir em relação à IA e à guerra.
Aqui está a parte estranha deste filme. O hacker, que agora está descoberto e trabalhando para os
mocinhos, desenvolve um método para ensinar a futilidade da IA. Ou seja, a IA entra em um
ambiente no qual aprende que vencer alguns jogos – jogo da velha, neste caso – não é possível.
Não importa o quão bem se jogue, no final, o jogo termina em impasse após impasse. A IA então
vai testar esse novo aprendizado sobre a guerra termonuclear. No final, a IA conclui que a única
jogada vencedora é não jogar.
A maioria das histórias que você ouve na mídia, a ficção científica que você lê e os filmes que você assiste
nunca consideram o ambiente de aprendizado. No entanto, o ambiente de aprendizado é uma parte
essencial da equação porque a forma como você configura o ambiente determina o que a IA aprenderá.
Ao lidar com equipamentos militares, provavelmente é uma boa ideia ensinar a IA a vencer, mas também
mostrar que alguns cenários simplesmente não podem ser vencidos, então a melhor jogada é não jogar.
A FAA emitiu um conjunto de regras conhecidas comoParte 107em agosto de 2016. Essas
regras definem o uso comercial de drones durante o dia. A lista completa de regras aparece
nohttps://www.faa.gov/news/fact_sheets/news_story.cfm?newsId=20516.
As regras se resumem a estas cinco regras simples:
A FAA em breve emitirá regras para voos noturnos de drones que dizem respeito a quando ele
pode estar fora da linha de visão e em ambientes urbanos, embora atualmente seja possível
obter isenções especiais da FAA. O objetivo de tais sistemas regulatórios é proteger a
segurança pública, uma vez que o impacto dos drones em nossas vidas ainda não está claro.
Essas regras também permitem que a inovação e o crescimento econômico sejam derivados de
tal tecnologia.
Cada país do mundo está tentando regular os drones neste momento. Esses
regulamentos garantem a segurança e impulsionam o uso de drones para fins
econômicos. Por exemplo, na França, a lei permite o uso de drones em aplicações
agrícolas com poucas restrições, posicionando o país entre os pioneiros em tais usos.
Atualmente, a falta de AI significa que os drones podem facilmente perder sua conexão e se
comportar de maneira irregular, às vezes causando danos (consultehttps://www.theatlantic.
com/technology/archive/2017/03/drones-invisible-fence-president/
518361/para detalhes). Embora alguns deles tenham medidas de segurança em caso de
perda de conexão com o controlador, como retorno automático ao ponto exato de
decolagem, a FAA restringe seu uso a ficar dentro da linha de visão do controlador.
viável e seguro:https://utm.arc.nasa.gov/.
Quando as restrições não são suficientes e os drones desonestos representam uma ameaça, a
polícia e as forças militares encontraram algumas contramedidas eficazes: derrubar o drone
com uma espingarda; pegá-lo jogando uma rede; bloqueando seus controles; derrubá-lo com
laser ou micro-ondas; e até disparando mísseis guiados contra ele.
»Entendendo o sentido-plano-ato
ciclo
Capítulo14
Utilizando o
Carro com IA
A
carro autônomo (carro SD) é umveículo autônomo,que é um veículo que pode
dirigir sozinho de um ponto de partida a um destino sem intervenção humana. A
autonomia implica não apenas ter algumas tarefas automatizadas (como o Active
Park Assist demonstrado emhttps://www.youtube.com/watch?v=xW-MhoLImqg),mas
ser capaz de executar as etapas certas para atingir os objetivos de forma independente.
Um carro SD executa todas as tarefas necessárias por conta própria, com um ser humano
potencialmente lá para observar (e não fazer mais nada). Como os carros SD fazem parte
da história há mais de 100 anos (sim, por incrível que pareça), este capítulo começa com
uma breve história dos carros SD.
Para uma tecnologia ter sucesso, ela deve fornecer um benefício que as pessoas considerem
necessário e não tão facilmente obtido por outros métodos. É por isso que os carros SD são tão
empolgantes. Eles oferecem muitas coisas de valor, além de apenas dirigir. A próxima seção do
capítulo mostra como os carros SD mudarão significativamente a mobilidade e ajuda você a
entender por que essa tecnologia é tão atraente.
O desenvolvimento de carros que podem dirigir sozinhos faz parte da visão futurista fornecida pela
narrativa e pelo filme de ficção científica desde os primeiros experimentos na década de 1920 com
carros operados por rádio. Você pode ler mais sobre a longa e fascinante história de
carros autônomos neste artigo emhttps://qz.com/814019/driverless-cars-are-
100 anos/.O problema com esses primeiros veículos é que eles não eram práticos;
alguém teve que segui-los para guiá-los usando um controlador de rádio.
Consequentemente, embora o sonho dos carros SD tenha sido cultivado por tanto tempo,
os projetos atuais têm pouco a compartilhar com o passado além da visão de autonomia.
Os carros SD modernos estão profundamente enraizados em projetos que começaram na década de 1980
(https://www.technologyreview.com/s/602822/in-the-1980s-the-
auto-condução-van-nasceu/).Esses esforços mais recentes aproveitam a IA para remover a necessidade de
controle de rádio encontrada em projetos anteriores. Muitas universidades e militares (especialmente pelo
Exército dos EUA) financiam esses esforços. Ao mesmo tempo, o objetivo era vencer em
o Grande Desafio DARPA (http://archive.darpa.mil/grandchallenge/),
que terminou em 2007. No entanto, agora as preocupações militares e comerciais fornecem
muitos incentivos para engenheiros e desenvolvedores continuarem avançando.
Os militares não são os únicos pressionando por veículos autônomos. Durante muito tempo, a
indústria automotiva sofreu com a superprodução porque pode produzir mais carros do que a
demanda do mercado. A demanda do mercado caiu como resultado de todos os tipos de pressões,
como a longevidade do carro. Na década de 1930, a longevidade média dos carros era de 6,75 anos,
mas os carros hoje têm uma média de 10,8 anos ou mais e permitem que os motoristas dirijam.
250.000 milhas ou mais. A queda nas vendas levou alguns fabricantes a sair do setor ou se
fundir e formar empresas maiores. Os carros SD são a bala de prata para a indústria,
oferecendo uma maneira de remodelar favoravelmente a demanda do mercado e convencer os
consumidores a atualizar. Essa tecnologia necessária resultará no aumento da produção de um
grande número de veículos novos.
»Nível 1 – assistência ao condutor:O controle ainda está nas mãos do motorista, mas o
carro pode realizar atividades de suporte simples, como controlar a velocidade. Esse nível de
automação inclui o controle de cruzeiro, quando você ajusta o carro para uma determinada
velocidade, o controle de estabilidade e os freios pré-carregados.
»Nível 2 – automação parcial:O carro pode atuar com mais frequência no lugar do motorista,
lidando com aceleração, frenagem e direção, se necessário. A responsabilidade do motorista é
permanecer alerta e manter o controle do carro. Um exemplo de automação parcial é a frenagem
automática que certos modelos de carros executam ao detectar uma possibilidade de colisão à frente
(um pedestre atravessando a rua ou outro carro parando repentinamente). Outros exemplos são o
controle de cruzeiro adaptativo (que não apenas controla a velocidade do carro, mas também adapta
a velocidade a situações como quando um carro está à sua frente) e a centralização da faixa. Este
nível está disponível em carros comerciais desde 2013.
»Nível 3 – automação condicional:A maioria das montadoras está trabalhando nesse nível
a partir da escrita deste livro.Automação condicionalsignifica que um carro pode dirigir sozinho em
certos contextos (por exemplo, apenas em rodovias ou estradas unidirecionais), sob limites de
velocidade e sob controle humano vigilante. A automação pode levar o humano a retomar o
controle da direção. Um exemplo desse nível de automação são os modelos de carros recentes que
dirigem sozinhos quando estão em uma rodovia e freiam automaticamente quando o tráfego
diminui devido a congestionamentos (ou engarrafamentos).
Mesmo quando os carros SD atingirem autonomia de nível 5, você não os verá percorrendo
todas as estradas. Esses carros ainda estão longe no futuro e podem haver dificuldades pela
frente. A seção “Superando a incerteza das percepções”, mais adiante neste capítulo, discute
alguns dos obstáculos que uma IA encontrará ao dirigir um carro. O carro SD não acontecerá
da noite para o dia; provavelmente acontecerá por meio de uma mutação progressiva,
começando com a introdução gradual de mais e mais modelos de carros automáticos. Os
humanos continuarão segurando o volante por muito tempo. O que você pode esperar ver é
uma IA que auxilia na direção normal e em condições perigosas para tornar a experiência de
dirigir mais segura. Mesmo quando os fornecedores comercializam carros SD, a substituição do
estoque real pode levar anos. O processo de revolucionar o uso da estrada em ambientes
urbanos com carros SD pode levar 30 anos.
Esta seção contém muitas datas e algumas pessoas tendem a pensar que qualquer data
que apareça em um livro deve ser precisa. Todos os tipos de coisas podem acontecer
para acelerar ou retardar a adoção de carros SD. Por exemplo, a indústria de seguros
atualmente desconfia dos carros SD porque teme que seus produtos de seguro
automóvel sejam descartados no futuro, pois o risco de sofrer um acidente de carro se
torna mais raro. (A consultoria McKinsey prevê que os acidentes serão reduzidos em
90 por cento:https://www.mckinsey.com/industries/automotive-and-assembly/ our-
insights/ten-ways-autonomous-driving-could-redefine-the-automotive-
mundo.)O lobby da indústria de seguros pode retardar a aceitação dos carros SD. Por outro
lado, as pessoas que sofreram a perda de um ente querido em um acidente tendem a apoiar
qualquer coisa que reduza os acidentes de trânsito. Eles podem ser igualmente bem-sucedidos
em acelerar a aceitação de carros SD. Consequentemente, dado o grande número de maneiras
pelas quais as pressões sociais mudam a história, não é possível prever uma data precisa para a
aceitação dos carros SD.
Hoje, o uso do carro molda tanto o tecido urbano quanto a vida econômica. Os carros
permitem que as pessoas percorram longas distâncias de casa para o trabalho todos os
dias (tornando possível o desenvolvimento imobiliário suburbano). As empresas enviam
mercadorias para distâncias maiores com facilidade; carros criam novos negócios e
empregos; e os operários da indústria automobilística há muito se tornaram os principais
atores de uma nova redistribuição de riquezas. O carro é o primeiro produto real do
mercado de massa, feito por trabalhadores para outros trabalhadores. Quando o negócio
de carros floresce, o mesmo acontece com as comunidades que o apoiam; quando
perece, pode ocorrer uma catástrofe. Trens e aviões estão vinculados a viagens pré-
determinadas, enquanto os carros não. O automóvel abriu e liberou a mobilidade em
larga escala, revolucionando, mais do que outros meios de transporte de longa distância,
o cotidiano das pessoas. Como Henry Ford,
Como quando os carros apareceram pela primeira vez, a civilização está à beira de uma nova
revolução provocada pelos carros SD. Quando os fornecedores apresentarem o nível 5 de
direção autônoma e os carros SD se tornarem populares, você pode esperar uma nova ênfase
significativa em como os humanos projetam cidades e subúrbios, na economia e no estilo de
vida de todos. Existem maneiras óbvias e menos óbvias de os carros SD mudarem a vida. As
mais óbvias e muitas vezes contadas na narrativa são as seguintes:
»Mais tempo:Os carros SD ajudarão os humanos a obter mais das coisas mais preciosas
na vida, como o tempo. Os carros SD não ajudarão as pessoas a ir mais longe, mas as
ajudarão a usar o tempo que gastariam dirigindo de outras maneiras (porque a IA estará
dirigindo). Além disso, mesmo que o tráfego aumente (devido a menores custos de
transporte e outros fatores), o tráfego ficará mais tranquilo,
Além desses efeitos imediatos estão as implicações sutis que ninguém pode determinar
imediatamente, mas que podem aparecer evidentes após a reflexão. Benedict Evans
aponta alguns deles em seu blog “Cars and second order cons-
quences”(http://ben-evans.com/benedictevans/2017/3/20/cars-and-second-
ordem-consequências).Este artigo perspicaz analisa mais profundamente as consequências
da introdução de carros elétricos e autonomia de nível 5 para carros SD no mercado. Como um
exemplo, os carros SD poderiam tornar o distópico Panopticon uma realidade
(verhttps://www.theguardian.com/technology/2015/jul/23/panopticon-digital-
vigilância-jeremy-bentham).O Panóptico é o edifício institucional teorizado pelo filósofo
inglês Jeremy Bentham no final do século XVIII, onde todos estão sob vigilância sem
terem consciência disso. Quando os carros SD circulam pelas ruas em grande número, as
câmeras dos carros aparecerão em todos os lugares, observando e possivelmente
relatando tudo o que testemunharem. Seu carro pode espionar você e outras pessoas
quando você menos espera.
Pensar no futuro não é um exercício fácil porque não é simplesmente uma questão de causa e
efeito. Mesmo olhar para ordens de efeitos mais remotas pode ser ineficaz quando o contexto
muda do esperado. Por exemplo, um futuro Panopticon pode nunca acontecer porque o
sistema legal pode forçar os carros SD a não comunicarem as imagens que capturam. Por essa
razão, os prognosticadores contam com cenários que são descrições aproximadas de um
futuro possível; esses cenários podem ou não ser capazes de acontecer, dependendo de
diferentes circunstâncias. Especialistas especulam que um carro habilitado com recursos de
direção autônoma pode se envolver em quatro cenários diferentes, cada um redefinindo como
os humanos usam ou até mesmo possuem um carro:
Oproblema do carrinhoé um desafio moral introduzido pela filósofa britânica Philippa Foot
em 1967 (mas é um dilema antigo). Neste problema, um bonde desgovernado está prestes
a matar várias pessoas que estão na pista, mas você pode salvá-las desviando o bonde para
outro trilho, onde infelizmente outra pessoa será morta em seu lugar. Claro, você precisa
escolher qual pista usar, sabendo que alguém vai morrer. Existem algumas variantes do
problema do bonde, e existe até um site do Instituto de Tecnologia de Massachusetts (MIT)
http://moralmachine.mit.edu/que propõe situações alternativas mais adequadas àquelas
que um carro SD pode vivenciar.
A questão é que surgem situações em que alguém vai morrer, por mais habilidosa que seja
a IA que está dirigindo o carro. Em alguns casos, a escolha não é entre duas pessoas
desconhecidas, mas entre o motorista e alguém na estrada. Tais situações acontecem
mesmo agora, e os humanos as resolvem deixando a escolha moral para o humano no
volante. Algumas pessoas se salvarão, algumas se sacrificarão por outras e algumas
escolherão o que consideram o mal menor ou o bem maior. Na maioria das vezes, trata-se
de uma reação instintiva feita sob pressão e medo que ameaçam a vida. A Mercedes-Benz, a
montadora mais antiga do mundo, afirmou que dará prioridade ao pas-
a vida dos mensageiros (verhttps://blog.caranddriver.com/self-driving-mercedeswill-
prioritize-occupant-safety-over-pedestrians/).Os fabricantes de carros podem
considere que um tipo de situação catastrófica com problema de bonde já é tão raro - e os carros SD o
tornarão ainda mais raro - e que a autoproteção é algo tão inato em nós que a maioria dos
compradores de carros SD concordará com essa escolha.
Solução de ponta a pontaé algo que você costuma ouvir ao discutir o papel do aprendizado profundo
na IA. Dado o poder de aprender com exemplos, muitos problemas não exigem soluções separadas,
que são essencialmente uma combinação de muitos problemas menores, cada um resolvido por uma
solução de IA diferente. O aprendizado profundo pode resolver o problema como um todo,
resolvendo exemplos e fornecendo uma solução única que engloba todos os problemas que exigiam
soluções separadas de IA no passado. O problema é que o aprendizado profundo é limitado em sua
capacidade de realmente executar essa tarefa hoje. Uma única solução de aprendizado profundo
pode funcionar para alguns problemas, mas outros ainda exigem que você combine soluções de IA
menores se quiser obter uma solução completa e confiável.
A NVidia, produtora de GPU de aprendizado profundo, está trabalhando em soluções de ponta a ponta. Verificar
sai o vídeo emhttps://www.youtube.com/watch?v=-96BEoXJMs0,que mostra
a eficácia da solução como um exemplo. No entanto, como acontece com qualquer aplicativo de
aprendizado profundo, a qualidade da solução depende muito da exaustividade e do número de
exemplos usados. Para que um carro SD funcione como uma solução de aprendizado profundo de
ponta a ponta, é necessário um conjunto de dados que ensine o carro a dirigir em um número
enorme de contextos e situações, que ainda não estão disponíveis, mas podem estar no futuro.
»O GPS informa onde o carro está no mundo (com a ajuda de um sistema de mapas),
que se traduz em coordenadas de latitude, longitude e altitude.
»Os dispositivos de radar, ultrassom e lidar localizam objetos e fornecem dados sobre
sua localização e movimentos em termos de mudança de coordenadas no espaço.
Muitos sensores especializados aparecem em um carro SD. A seção “Superando a Incerteza das
Percepções”, posteriormente neste capítulo, descreve-as detalhadamente e revela como o sistema
combina sua saída. O sistema deve combinar e processar os dados do sensor antes que as percepções
necessárias para o funcionamento de um carro se tornem úteis. A combinação dos dados do sensor,
portanto, define diferentes perspectivas do mundo ao redor do carro.
Localizaçãoé saber onde o carro está no mundo, tarefa feita principalmente pelo
processamento dos dados do aparelho GPS. O GPS é um sistema de navegação por
satélite baseado no espaço originalmente criado para fins militares. Quando usado para
fins civis, possui algumas imprecisões incorporadas (de modo que apenas pessoas
autorizadas podem usá-lo com precisão total). As mesmas imprecisões também
aparecem em outros sistemas, como o GLONASS (o sistema de navegação russo), o
GALILEO (ou GNSS, o sistema europeu) ou o BeiDou (ou BDS, o sistema chinês).
Conseqüentemente, não importa qual constelação de satélite você use, o carro pode
dizer que está em uma determinada estrada, mas pode perder a faixa que está usando
(ou até mesmo acabar rodando em uma estrada paralela). Além da localização
aproximada fornecida pelo GPS,
Osistema de detecçãodetermina o que está ao redor do carro. Este sistema requer muitos
subsistemas, cada um realizando uma finalidade específica usando uma combinação única de
dados de sensor e análise de processamento:
»Os dados do Lidar são usados principalmente para detectar espaço livre na estrada (um
pista estruturada ou vaga de estacionamento).
Pode parecer um pouco complicado, mas são apenas três sistemas atuando, um após o
outro, do início ao fim no destino. Cada sistema contém subsistemas que resolvem um
único problema de direção, conforme ilustrado na Figura 14-1, usando os algoritmos
mais rápidos e confiáveis.
FIGURA 14-1:
Um geral,
visão esquemática de
os sistemas
trabalhando em um
carro SD.
OParadoxo Moravecdiz que o que é fácil para os humanos é difícil para a IA (e vice-versa),
conforme explicado na década de 1980 pelos cientistas da robótica e da cognição Hans
Moravec, Rodney Brooks e Marvin Minsk. O ser humano levou muito tempo para desenvolver
habilidades como andar, correr, pegar um objeto, falar e ver; essas habilidades se
desenvolveram por meio da evolução e da seleção natural ao longo de milhões de anos. Para
sobreviver neste mundo, os humanos fazem o que todos os seres vivos fizeram desde que a
vida existe na Terra. Por outro lado, a alta abstração e a matemática são uma descoberta
relativamente nova para os humanos, e não estamos naturalmente adaptados a eles.
Os carros têm algumas vantagens sobre os robôs, que precisam abrir caminho em edifícios e
em terrenos externos. Os carros operam em estradas criadas especificamente para eles,
geralmente bem mapeadas, e os carros já possuem soluções mecânicas funcionais para se
mover nas superfícies das estradas.
Os atuadores não são o maior problema para carros SD. Planejamento e detecção são o que
representam sérios obstáculos. O planejamento está em um nível superior (no que a IA geralmente se
destaca). Quando se trata de planejamento geral, os carros SD já contam com navegadores GPS, uma
espécie de IA especializada em fornecer direções. A detecção é o verdadeiro gargalo para carros SD
porque sem ela, nenhum planejamento e atuação são possíveis. Os motoristas sentem o
O hardware de detecção é atualizado continuamente nesta fase da evolução dos carros SD para encontrar
soluções mais confiáveis, precisas e menos dispendiosas. Por outro lado, tanto o processamento de dados do
sensor quanto o uso eficaz deles dependem de algoritmos robustos, como
ofiltro de Kalman(verhttp://www.bzarg.com/p/how-a-kalman-filter-worksin-pictures/e
https://home.wlu.edu/~levys/kalman_tutorial/),qual
já existem há algumas décadas.
As limitações vêm em várias formas. Ao explorar o que os sensores fazem para um carro
SD, você deve considerar custo, sensibilidade à luz, sensibilidade ao clima, gravação
ruidosa (o que significa que a sensibilidade do sensor muda, afetando a precisão), alcance
e resolução. Por outro lado, as capacidades envolvem a capacidade de rastrear a
velocidade, posição, altura e distância de objetos com precisão, bem como a habilidade
de detectar o que são esses objetos e como classificá-los.
Câmera
As câmeras são sensores passivos baseados em visão. Eles podem fornecer visão mono ou estéreo.
Devido ao seu baixo custo, você pode colocar muitos deles no para-brisa dianteiro, bem como nas
grades dianteiras, retrovisores laterais, porta traseira e para-brisa traseiro. Normalmente, as câmeras
de visão estéreo imitam a percepção humana e recuperam informações na estrada e de veículos
próximos, enquanto as câmeras de visão mono geralmente são especializadas na detecção de sinais
de trânsito e semáforos. Os dados que eles capturam são processados por algoritmos para
processamento de imagens ou por redes neurais de aprendizado profundo para fornecer informações
de detecção e classificação (por exemplo, detectar um sinal vermelho ou um sinal de trânsito com
limite de velocidade). As câmeras podem ter alta resolução (podem detectar pequenos detalhes), mas
são sensíveis à luz e às condições climáticas (noite, neblina ou neve).
Sensores ultrassônicos
Os sensores ultrassônicos são semelhantes aos radares, mas usam sons de alta
frequência (ultrassons, inaudíveis por humanos, mas audíveis por certos animais) em vez
de micro-ondas. A principal fraqueza dos sensores ultrassônicos (usados pelos
fabricantes em vez dos lidars mais frágeis e caros) é seu curto alcance.
Os carros SD estão aqui para melhorar a nossa mobilidade, o que significa preservar a nossa
vida e a dos outros. Um carro SD não pode deixar de detectar um pedestre que aparece de
repente na frente dele. Por motivos de segurança, os fornecedores concentram muito esforço
na fusão de sensores, que combina dados de diferentes sensores para obter uma medição
unificada que é melhor do que qualquer medição isolada. A fusão do sensor é mais comumente
o resultado do uso de variantes do filtro de Kalman (como o Filtro de Kalman Estendido ou o
ainda mais complexo Filtro de Kalman Sem Perfume). Rudolf E. Kálmán era um húngaro
FIGURA 14-3:
Um filtro de Kalman
estima o
trajetória de um
bicicleta por fusão
radar e
dados lidar.
Desta forma, um carro SD pode alimentar o algoritmo com as medições do sensor e usá-
las para obter uma estimativa resultante dos objetos ao redor. A estimativa combina
todos os pontos fortes de cada sensor e evita seus pontos fracos. Isso é possível porque o
filtro funciona usando uma versão mais sofisticada das probabilidades e do teorema de
Bayes, descritos no Capítulo 10.
Capítulo 15
Entendendo o
Aplicativo não iniciador
P
Os capítulos anteriores deste livro exploram o que a IA é e o que não é, juntamente com quais
problemas ela pode resolver bem e quais problemas estão aparentemente fora de alcance.
Mesmo com todas essas informações, você pode reconhecer facilmente um aplicativo em
potencial que nunca verá a luz do dia porque a IA simplesmente não pode atender a essa necessidade
específica. Este capítulo explora o aplicativo não iniciador. Talvez o capítulo devesse ser renomeado
como “Por que ainda precisamos de humanos”, mas o título atual é mais claro.
Como parte deste capítulo, você descobrirá os efeitos de tentar criar aplicativos não iniciais. O
mais preocupante desses efeitos é o inverno da IA. Uminverno AI ocorre sempre que as
promessas dos proponentes da IA excedem sua capacidade de entrega, resultando em perda
de financiamento dos empreendedores.
A IA também pode cair na armadilha de desenvolver soluções para problemas que realmente não existem.
Sim, as maravilhas da solução realmente parecem bastante sofisticadas, mas, a menos que a solução atenda a
uma necessidade real, ninguém a comprará. As tecnologias prosperam apenas quando atendem às
necessidades que os usuários estão dispostos a gastar dinheiro para obter. Este capítulo termina com uma
análise das soluções para problemas que não existem.
Você notará rapidamente na Tabela 1-1 que a IA não aborda dois tipos de inteligência e fornece
apenas uma capacidade modesta com mais três. A IA se destaca quando se trata de
matemática, lógica e inteligência cinestésica, limitando sua capacidade de resolver muitos tipos
de problemas que uma sociedade totalmente funcional precisa resolver. As seções a seguir
descrevem situações em que a IA simplesmente não funciona porque é uma tecnologia — não
uma pessoa.
Definindo os limites da IA
Ao falar com Alexa, você pode esquecer que está falando com uma máquina. A máquina não
tem ideia do que você está dizendo, não entende você como pessoa e não tem nenhum desejo
real de interagir com você; ele age apenas conforme definido pelos algoritmos criados para ele
e pelos dados que você fornece. Mesmo assim, os resultados são surpreendentes. É fácil
antropomorfizar a IA sem perceber e vê-la como uma extensão de uma entidade semelhante à
humana. No entanto, uma IA carece dos fundamentos descritos nas seções a seguir.
criatividade
Você pode encontrar uma variedade infinita de artigos, sites, música, arte, escritos e todos os tipos de
resultados supostamente criativos de uma IA. O problema com a IA é que ela não pode criar nada.
Quando você pensa em criatividade, pense em padrões de pensamento. Por exemplo, Beethoven
tinha uma maneira distinta de pensar sobre música. Você pode reconhecer uma peça clássica de
Beethoven mesmo que não esteja familiarizado com todas as suas obras porque a música tem um
padrão específico, formado pela maneira como Beethoven pensava.
Uma IA pode criar uma nova peça de Beethoven visualizando seu processo de pensamento
matematicamente, o que a IA faz aprendendo com exemplos musicais de Beethoven. A base
resultante para a criação de uma nova peça de Beethoven é de natureza matemática. Na
verdade, por causa da matemática dos padrões, você pode ouvir uma IA tocar Beethoven da
perspectiva de um dos Beatles emhttps://techcrunch.com/2016/
29/04/paul-mccartificial-intelligence/.
Imaginação
Criar é definir algo real, seja música, arte, escrita ou qualquer outra atividade que resulte
em algo que outros possam ver, ouvir, tocar ou interagir de outras maneiras. A
imaginação é a abstração da criação e, portanto, está ainda mais fora do alcance da
capacidade da IA. Alguém pode imaginar coisas que não são reais e nunca podem ser
reais. A imaginação é a mente vagando pelos campos de atuação, brincando com o que
poderia ser se as regras não atrapalhassem. A verdadeira criatividade costuma ser o
resultado de uma imaginação bem-sucedida.
De uma perspectiva puramente humana, todos podem imaginar algo. A imaginação nos
diferencia de tudo e muitas vezes nos coloca em situações que não são reais
de forma alguma. OHuffington Postartigo emhttps://www.huffingtonpost.com/
lamishaserfwalls/5-reasons-imagination-is-_b_6096368.htmlfornece cinco razões
que a imaginação é fundamental para superar os limites da realidade.
Assim como uma IA não pode criar novos padrões de pensamento ou desenvolver novos
dados sem usar fontes existentes, ela também deve existir dentro dos limites da
realidade. Consequentemente, é improvável que alguém desenvolva uma IA com
imaginação. A imaginação não apenas requer inteligência criativa, mas também
inteligência intrapessoal, e uma IA não possui nenhuma forma de inteligência.
ideias originais
Imaginar algo, criar algo real a partir do que foi imaginado e então usar aquele exemplo
do mundo real de algo que nunca existiu no passado é desenvolver uma ideia. Para criar
uma ideia com sucesso, um ser humano precisa de boa inteligência criativa, intrapessoal
e interpessoal. Criar algo novo é ótimo se você quiser definir versões únicas de algo ou se
divertir. No entanto, para transformá-la em uma ideia, você deve compartilhá-la com
outras pessoas de uma maneira que permita que elas também a vejam.
A seção “Considerando os Cinco Mistruths em Dados” do Capítulo 2 fala sobre problemas de dados
que uma IA deve superar para executar as tarefas para as quais foi projetada. O único problema é que
uma IA normalmente não consegue reconhecer inverdades nos dados com facilidade, a menos que
haja uma riqueza de dados de exemplo que não contenham essas inverdades, o que pode ser mais
difícil de encontrar do que você pensa. Os humanos, por outro lado, muitas vezes podem identificar as
inverdades com relativa facilidade. Tendo visto mais exemplos do que qualquer IA jamais verá, um
humano pode identificar as inverdades por meio da imaginação e da criatividade. Um humano pode
imaginar a inverdade de uma maneira que a IA não consegue, porque a IA está presa na realidade.
Mistruths são adicionados aos dados de tantas maneiras que nem mesmo é possível listá-
los todos. Os humanos costumam adicionar essas inverdades sem pensar nisso. Na
verdade, evitar inverdades pode ser impossível, causadas como são por perspectiva, viés
e quadro de referência às vezes. Como uma IA não consegue identificar todas as
inverdades, os dados usados para tomar decisões sempre terão algum nível de
deficiência. Se essa deficiência afeta a capacidade da IA de produzir uma saída útil
depende do tipo e nível de deficiência, juntamente com as capacidades dos algoritmos.
Há também a questão de falar uma verdade dolorosa que uma IA nunca será capaz de
lidar porque ela carece de emoção. Averdade dolorosaé aquele em que o destinatário não
ganha nada de útil, mas recebe informações que causam danos - sejam emocionais,
físicos ou intelectuais. Por exemplo, uma criança pode não saber que um dos pais foi
infiel a outro. Como ambos os pais faleceram, a informação não é mais pertinente e seria
melhor permitir que a criança permanecesse em estado de êxtase. No entanto, alguém
chega e garante que as memórias da criança sejam danificadas ao discutir a infidelidade
em detalhes. A criança não ganha nada, mas é definitivamente ferida. Uma IA poderia
causar o mesmo tipo de dano ao revisar as informações da família de maneiras que a
criança nunca consideraria. Ao descobrir a infidelidade através de uma combinação de
policiais
Aplicando IA incorretamente
Os limites da IA definem as possibilidades de aplicação correta da IA. No entanto, mesmo
dentro desse domínio, você pode obter uma saída inesperada ou inútil. Por exemplo, você pode
fornecer várias entradas a uma IA e, em seguida, solicitar uma probabilidade de certos eventos
ocorrerem com base nessas entradas. Quando dados suficientes estão disponíveis, a IA pode
produzir um resultado que corresponda à base matemática dos dados de entrada. No entanto,
a IA não pode produzir novos dados, criar soluções com base nesses dados, imaginar novas
formas de trabalhar naquele dia ou fornecer ideias para implementar uma solução. Todas essas
atividades residem no reino humano. Tudo o que você deve esperar é uma previsão de
probabilidade.
Outra questão é se o conjunto de dados contém algum tipo de opinião, que é muito mais
prevalente do que você imagina. Uma opinião difere de um fato porque o fato é
completamente demonstrável e todos concordam que um fato é verdadeiro (pelo menos,
todos com uma mente aberta). As opiniões ocorrem quando você não tem fatos
científicos suficientes para respaldar os dados. Além disso, as opiniões ocorrem quando a
emoção está envolvida. Mesmo diante de provas conclusivas em contrário, alguns
humanos preferem confiar em opiniões do que em fatos. A opinião nos deixa à vontade;
o fato não. A IA quase sempre falhará quando a opinião estiver envolvida. Mesmo com o
melhor algoritmo disponível, alguém ficará insatisfeito com o resultado.
»Tecnologia deficiente:Em muitos lugares deste livro, você descobre que um problema
não era solucionável em um determinado momento devido à falta de tecnologia. Não é
realista pedir a uma IA para resolver um problema quando a tecnologia é insuficiente. Por
exemplo, a falta de sensores e poder de processamento teria tornado impossível a criação
de um carro autônomo na década de 1960, mas os avanços na tecnologia tornaram esse
empreendimento possível hoje.
Entendendo o inverno da IA
É difícil dizer com precisão quando a IA começou. Afinal, até os antigos gregos sonhavam
em criar homens mecânicos, como os apresentados nos mitos gregos sobre Hefesto e a
Galatea de Pigmalião, e podemos supor que esses homens mecânicos teriam algum tipo
de inteligência. Consequentemente, pode-se argumentar que o primeiro inverno da IA
realmente ocorreu em algum momento entre a queda do império romano e a época na
idade média, quando as pessoas sonhavam com uma maneira alquímica de colocar a
mente na matéria, como Takwin de Jābir ibn Hayyān, o de Paracelso homúnculo e o
Golem do rabino Judah Loew. No entanto, esses esforços são histórias infundadas e não
do tipo científico que apareceria mais tarde em 1956 com a fundação da pesquisa de
inteligência artificial financiada pelo governo no Dartmouth College.
Mesmo os pesquisadores muitas vezes foram levados a pensar que o computador estava
fazendo mais do que realmente fazia. Por exemplo, a ELIZA de Joseph Weizenbaum
parecia ouvir a entrada e depois responder de maneira inteligente. Infelizmente, as
respostas foram enlatadas e o aplicativo não estava ouvindo, entendendo ou dizendo
nada. No entanto, ELIZA foi o primeiro chatterbot e representou um passo à frente,
embora incrivelmente pequeno. O hype foi simplesmente significativamente maior do
que a tecnologia real – um problema que a IA enfrenta hoje. As pessoas ficam
desapontadas quando veem que o hype não é real, então cientistas e promotores
continuam se preparando para o fracasso exibindo brilho em vez de tecnologia real. O
primeiro inverno de IA foi provocado por previsões como estas:
Ao ver essas reivindicações bizarras hoje, é fácil ver por que os governos retiraram o
financiamento. A seção “Considerando o argumento da Sala Chinesa” do Capítulo 5
descreve apenas um dos muitos contra-argumentos que até mesmo pessoas dentro da
comunidade de IA fizeram contra essas previsões.
O segundo inverno de IA surgiu como resultado dos mesmos problemas que criaram o primeiro
inverno de IA – superpromessas, superexcitação e otimismo excessivo. Nesse caso, o boom começou
com o sistema especialista, uma espécie de programa de IA que resolve problemas por meio de
regras lógicas. Além disso, os japoneses entraram na briga com seu projeto de computador de quinta
geração, um sistema de computador que oferecia processamento massivamente paralelo. A ideia era
criar um computador que pudesse realizar muitas tarefas em
O fim veio como uma espécie de bolha econômica. Os sistemas especialistas mostraram-se frágeis, mesmo
quando executados em sistemas de computador especializados. Os sistemas de computador especializados
acabaram como sumidouros econômicos que os sistemas de computador comuns mais novos poderiam
facilmente substituir a um custo significativamente reduzido. Na verdade, o projeto japonês de computadores
de quinta geração também foi uma fatalidade dessa bolha econômica. Provou-se extremamente caro para
construir e manter.
A questão é que os invernos de IA não são necessariamente ruins para a IA. Na verdade, essas
ocasiões para dar um passo atrás e ver o progresso (ou a falta dele) das estratégias atuais são
importantes. Aproveitar esses momentos de reflexão é difícil quando se está correndo de
cabeça para a próxima conquista esperançosa.
Definindo um dispositivo
Quando se trata de IA, o mundo está cheio de aparelhos. Alguns desses aparelhos são
realmente úteis, mas muitos não são, e alguns ficam entre esses dois extremos. Por
exemplo, o Alexa vem com muitos recursos úteis, mas também vem com um monte de
aparelhos que vão deixar você coçando a cabeça quando tentar usá-los. Este artigo de
John Dvorak pode parecer excessivamente pessimista, mas fornece o que pensar sobre
os tipos de recursos que o Alexa oferece:https://www.pcmag.com/commentary/
354629/just-say-no-to-amazons-echo-show.
Umdispositivo de IAé qualquer aplicativo que à primeira vista parece fazer algo
interessante, mas acaba se mostrando incapaz de realizar tarefas úteis. Aqui estão alguns
dos aspectos comuns a serem observados ao determinar se algo é um dispositivo. (A
primeira letra de cada marcador na lista forma o acrônimo CREEP, ou seja, não crie um
aplicativo de IA assustador):
acordo. Pagar mais por um benefício semelhante simplesmente não atrairá atenção.
Evitando o infomercial
Deslumbrar usuários em potencial de seu aplicativo de IA é um sinal claro de que o aplicativo
falhará. Curiosamente, os aplicativos que obtêm sucesso com maior facilidade são
Procure um futuro em que a IA atue como assistente dos humanos. Na verdade, você verá esse
uso da IA cada vez mais com o passar do tempo. Os melhores aplicativos de IA serão aqueles
que procuram ajudar, em vez de substituir, os humanos. Sim, é verdade que os robôs
substituirão os humanos em condições perigosas, mas os humanos precisarão tomar decisões
sobre como evitar piorar essas situações, o que significa ter um humano em um local seguro
para direcionar o robô. É uma colaboração de mãos dadas entre a tecnologia e os humanos.
CONSIDERANDO A REVOLUÇÃO
INDUSTRIAL
A colaboração humano/IA não acontecerá de uma só vez. Além disso, os novos tipos de trabalho
que os humanos serão capazes de realizar não entrarão em cena imediatamente. No entanto, a
visão de humanos apenas sentados esperando para serem atendidos por uma máquina é absurda
e obviamente insustentável. Os humanos continuarão a realizar várias tarefas.
Claro, as mesmas reivindicações de máquinas assumindo o controle ocorreram durante todas as
grandes convulsões humanas no passado, com a revolução industrial sendo a mais recente e mais
violenta dessas convulsões (verhttp://www.historydoctor.net/Advanced%20
Placement%20World%20History/40.%20The_Industrial_revolution.htm).
Os humanos sempre farão certas coisas melhor do que uma IA, e você pode ter certeza de que
continuaremos a criar um lugar para nós mesmos na sociedade. Só precisamos esperar que essa
convulsão seja menos violenta do que foi a revolução industrial.
Claro, surge a questão de por que o KISS é tão importante. A resposta mais fácil é que a
complexidade leva ao fracasso: quanto mais partes algo tiver, maior a probabilidade de
falhar. Este princípio tem suas raízes na matemática e é fácil de provar.
»Investigando o universo
Capítulo16
Vendo AI no espaço
P
As pessoas têm observado os céus desde tempos imemoriais. Muitos dos nomes
de constelações e estrelas vêm dos gregos ou de outros antigos (dependendo de
onde você mora). A Ursa Maior sozinha tem muitos nomes diferentes e pode ser
vista como um urso quando agrupada com outras estrelas (verhttp://newsok.com/article/
3035192para detalhes). As pessoas adoram olhar para as estrelas e pensar nelas, e é por
isso que muitas culturas pensaram em realmente ver como são as estrelas. À medida que
as pessoas se tornaram capazes de viajar pelo espaço, o universo como um todo assumiu
um novo significado, conforme descrito neste capítulo. A IA permite que as pessoas
vejam o universo com mais clareza e o visualizem de novas maneiras.
Viver e trabalhar no espaço é uma coisa, mas passar férias no espaço é outra bem
diferente. Já em 2011, começou-se a falar na possibilidade de criar um hotel em
Órbita próxima da Terra (http://mashable.com/2011/08/17/commercial-space-
estação/)ou a lua. Embora a construção de um hotel na órbita próxima à Terra pareça
viável neste ponto (http://www.newsweek.com/spacex-takes-space-hotel-
módulo-órbita-445616),o hotel da lua parece muita conversa (http://www.
bbc.com/future/story/20120712-where-is-hiltons-lunar-hotel).O ponto
ou seja, a IA permitirá que as pessoas vivam, trabalhem e até passem férias no espaço usando estruturas
especializadas, conforme descrito neste capítulo.
Observando o Universo
Um fabricante de óculos holandês chamado Hans Lippershey é creditado com a invenção de um
telescópio (que naquela época, por volta de 1600, era chamadoóculos de perspectiva holandeses). (Na
verdade, quem inventou o telescópio é um assunto para um debate significativo; veja
https://www.space.com/21950-who-invented-the-telescope.html.)cientistas
como o astrônomo italiano Galileu Galilei imediatamente começaram a escanear os céus
com algo mais do que seus olhos. Assim, os telescópios existem há muito tempo e se
tornaram maiores, mais complexos e até baseados no espaço ao longo dos anos.
A razão para colocar telescópios no espaço é que a atmosfera da Terra torna impossível
obter imagens claras de qualquer coisa muito distante. O telescópio Hubble é um dos
primeiros e mais famosos dos telescópios espaciais (ver
https://www.nasa.gov/audience/forstudents/5-8/features/nasa-knows/whatis-the-
hubble-space-telecope-58.html).Conforme descrito a seguir
seções, o uso de telescópios modernos requer IA de várias maneiras, como
agendar tempo para usar o Hubble (verhttp://ieeexplore.ieee.org/document/63800/?
reload=true).
Para fornecer uma ótica ainda melhor, os telescópios futuros apresentarão correção 3-D de
efeitos de desfoque usando ótica adaptativa multiconjugada (http://eso-ao.indmath.
uni-linz.ac.at/index.php/systems/multi-conjugate-adaptive-optics.
html).Essa nova tecnologia corrigirá o estreito campo de visão sofrido pelos telescópios
atuais, mas exigirá um controle ainda maior (e mais preciso) de vários níveis de atuador
por meio de vários espelhos. Novos telescópios, como o Giant Magellan Telescope, o
Thirty-Meter Telescope e o European
Telescópio Extremamente Grande (verhttps://www.space.com/8299-world-largest-
telescópio-construído-chile.html)contará com essa tecnologia para fazer valer o esforço
de seu investimento de mais de US$ 1 bilhão.
A ideia de ter lugares para ir realmente não se tornou uma realidade antes do
primeiro pouso na lua em 20 de julho de 1969 (verhttps://www.nasa.gov/mission_pages/
apollo/apollo11.html).Sim, podíamos olhar, mas não podíamos tocar. Mesmo assim, desde aquela
época, as pessoas procuraram todos os tipos de lugares para ir e chegaram a alguns deles.
eles, como Marte (https://www.space.com/33468-viking-1-first-marslanding-
pictures.html)e o cometa Rosetta (verhttps://www.usnews.com/news/articles/
2014/11/12/rosetta-comet-landing-is-space-game-
trocador).Cada uma dessas explorações serve para estimular o desejo humano de ir a
outros lugares novos. Mais importante, nenhum deles teria acontecido sem a matemática
complexa que a IA pode realizar.
Felizmente, nosso próprio sistema solar contém todos os tipos de lugares que podem ser
alcançados. Por exemplo, oEnciclopédia Britânicarecomenda visitar lugares como a Bacia
Caloris em Mercúrio (verhttps://www.britannica.com/list/
10-lugares-a-visitar-no-sistema-solar).Você também pode querer verificar
TravelTips4Life (http://www.traveltips4life.com/15-places-we-want-to-
visita-no-espaço/),que recomenda a Estação Espacial Internacional como primeira
parada.
Considere apenas uma exploração: o pouso da Apollo 11 na lua. As pessoas ainda sentem
os efeitos da explosão tecnológica que ocorreu durante os preparativos para aquela
missão. Por exemplo, a necessidade de economizar espaço levou o governo a gastar
muito dinheiro em tecnologias como circuitos integrados (CIs) que tomamos por
concedido hoje (verhttps://www.computerworld.com/article/2525898/
appdevelopment/nasa-s-apollo-technology-has-changed-history.html).
Dependendo da fonte que você lê, cada dólar investido em pesquisa pelo governo na
NASA rende aos americanos US$ 7 a US$ 8 em bens e serviços hoje.
No entanto, a corrida espacial gerou novas tecnologias além da criação de cápsulas reais
e seus componentes associados. Por exemplo, o filmefiguras escondidas
(https://www.amazon.com/exec/obidos/ASIN/B01LTI1RHQ/datacservip0f-20/)
apresenta uma visão da NASA que a maioria das pessoas não pensa: toda essa matemática requer
muito poder de computação. No filme, você vê a evolução da matemática da NASA de computadores
humanos para computadores eletrônicos. No entanto, assista ao filme com atenção e você verá que o
computador acaba trabalhando ao lado do humano, assim como a IA trabalhará ao lado dos humanos
à medida que nosso conhecimento do universo aumenta.
Hoje temos dados sobre o espaço vindos de todos os lugares. Esses dados estão nos ajudando a criar
novos princípios científicos sobre coisas que nem conseguimos ver, comoespaço escuro (uma área de
espaço com massa, mas sem presença visível) eenergia escura(uma forma de energia desconhecida e
não identificada que neutraliza os efeitos da gravitação entre os corpos no espaço). Ao entender essas
entidades invisíveis, construímos novos conhecimentos sobre como as forças funcionam em nosso
próprio planeta. Os pesquisadores estão tão imersos em dados, no entanto, que devem usar IA
apenas para entender uma pequena parte deles (consulte
https://www.theverge.com/2017/11/15/16654352/ai-astronomy-space-
dados de exploração).A questão é que o futuro do espaço e nosso uso de tecnologias
criadas para o espaço dependem do uso de todos os dados que estamos coletando, o
que requer IA neste momento.
CONSIDERANDO A CRÍTICA
Poucas pessoas apreciam o papel do crítico na sociedade - você sabe, aquela pessoa que encontra uma
nuvem escura em cada fresta de esperança, os buracos em cada estrada, o lado negativo de cada
positivo. O crítico pode ser aquele velho mesquinho rabugento que é retratado como o pior tipo de mal
na maioria da mídia. No entanto, o crítico tem um papel importante a desempenhar na IA baseada no
espaço. Bem dirigido, o crítico pode agregar o planejamento de longo prazo que aparentemente falta aos
membros mais positivos de uma equipe. Enquanto todo mundo está focando a atenção em soluções
criativas para problemas existentes, o crítico vê problemas futuros que realmente importam quando se
trata de aplicativos baseados em IA, como os usados para mineração.
Uma IA baseada no espaço terá que ter mais independência do que qualquer contraparte
terrestre. Ao olhar para as várias sondagens que os humanos lançaram até hoje, torna-se
evidente que o planejamento para o não planejável é um requisito, não um recurso agradável de
se ter. Uma IA baseada no espaço precisaria ter funcionalidade para aprender com o ambiente em
que está inserida e definir soluções para problemas que os desenvolvedores humanos podem não
ter pensado, como efeitos gravitacionais inesperados, falhas de equipamentos, falta do substituto
certo peças, e assim por diante. O equipamento também precisa enfrentar alguns desafios não
enfrentados atualmente pela IA baseada no espaço, como hackers tentando roubar remessas. A
mente crítica fornece ampla contribuição sobre essas questões, tornando-se uma parte essencial
de qualquer equipe.
A barra lateral “Entendendo a orientação de ensino” no Capítulo 13 também contém lições importantes
para a IA baseada no espaço. Uma dessas lições é sobre futilidade – ou seja, saber quando o cenário sem
vitória está em vigor. Uma IA baseada no espaço poderia então tomar contra-medidas para evitar danos,
em vez de necessariamente tentar consertar um problema que não pode consertar. O espaço terá
incógnitas infinitas, o que significa que a intervenção humana será necessária, mas essa intervenção
pode demorar meses. Uma IA baseada no espaço precisa saber como manter o potencial de capacidade
operacional enquanto espera. A discussão em
https://worldbuilding.stackexchange.com/questions/66698/what-issueswould-
an-ai-asteroid-mining-stations-have-to-be-prepared-foroferece apenas
uma pequena amostra do incrível número de problemas que uma IA espacial enfrentaria.
Neste ponto, um robô será enviado para fazer algo com o asteróide. A maioria das pessoas acha
que a mineração ocorrerá no local, mas, na verdade, a mineração no local seria perigosa e cara.
Outra ideia é mover o asteróide para um local mais seguro, como em órbita ao redor da lua, para
realizar a mineração necessária. Na verdade, existe financiamento para isso
muito projeto (verhttps://www.outerplaces.com/science/item/1332-nasa-
toreceive-100m-budget-for-asteroid-capturepara detalhes). A questão é que os robôs
faria a movimentação e possivelmente outros robôs fariam a mineração. Os humanos podem estar envolvidos no
reparo de robôs e provavelmente envolvidos no monitoramento de atividades de drones e robôs. Pense nisso
como uma mineração mais segura, menos poluente e mais interessante do que poderia acontecer aqui na Terra.
Colheita de água
A água cobre cerca de 71 por cento da terra. Na verdade, a terra tem tanta água que
muitas vezes achamos difícil mantê-la fora de lugares onde não a queremos. No entanto,
a terra é uma exceção à regra. O espaço não tem superabundância de água. Claro, você
pode se perguntar por que precisaria de água no espaço, além do tipo necessário para
manter os astronautas hidratados e potencialmente para manter as plantas irrigadas. O
fato é que a água é um ótimo combustível para foguetes. A separação de HO em
2 seus
componentes constituintes produz hidrogênio e oxigênio, que são compostos
quantidades de combustível de foguete hoje (verhttps://www.nasa.gov/topics/technology/
hydrogen/hydrogen_fuel_of_choice.htmlpara detalhes). Conseqüentemente, aquele grande,
bola de gelo suja no céu pode acabar sendo uma estação de reabastecimento em algum momento.
O celular que você carrega, o iPad que usa, o carro que dirige, a televisão que assiste e o
painel solar e o moinho de vento que fornecem eletricidade à sua casa dependem de
materiais extremamente perigosos na forma de terras raras (consultehttp://
www.rareearthtechalliance.com/Applications/Electronics.htmlpor apenas um
alguns exemplos de uso). A maioria das pessoas nem sabe que esses materiais não são
sustentáveis devido à maneira como os usamos atualmente (http://www.pbs.org/
wgbh/nova/next/physics/rare-earth-elements-in-cell-phones/).Considerando a
histórico desses minerais, eles representam a melhor razão para minerar minerais fora do
planeta, onde as toxinas não nos afetarão mais. Na verdade, a mineração deveria ser apenas o
primeiro passo; toda a fabricação também deveria sair do planeta (sim, o potencial de poluição
é tão grande).
A IA é essencial para os esforços para encontrar melhores fontes de terras raras que não
poluam nosso planeta até o esquecimento. Uma das peculiaridades interessantes das terras
raras é que a lua tem um suprimento significativo delas (vejahttps://www.washingtonpost.com/
nacional/health-science/moon-draws-growing-interest-as-a-potentialsource-of-rare-
minerals/2012/01/30/gIQAqHvUuQ_story.html?utm_
termo=.828c9cb19a34).Na verdade, muitos políticos agora veem a mineração da lua em busca de raros
terras como uma necessidade estratégica (verhttps://sservi.nasa.gov/articles/is-
miningrare-minerals-on-the-moon-vital-to-national-security/).O problema é
que os esforços para descobrir exatamente como a lua é feita não foram totalmente bem-
sucedidos até agora e é importante saber o que esperar. A Minerologia da Lua
Mapeador (https://www.jpl.nasa.gov/missions/moon-mineralogy-mapper-m3/)
é apenas um dos muitos esforços para descobrir a composição da lua. Além disso, para
processar com sucesso as terras raras e transformá-las em produtos úteis, a lua
precisaria de uma fonte de água, que aparentemente possui (verhttps://
news.nationalgeographic.com/2017/07/water-moon-formed-volcanoes-
vidro-espaço-ciência/).As sondas, robôs, análise de dados e todos os
A tabela periódica que contém uma lista de todos os elementos disponíveis recebeu várias
atualizações ao longo dos anos. De fato, quatro novos elementos apareceram na tabela
em 2016 (verhttps://www.sciencenews.org/blog/science-ticker/four-newestelements-
periodic-table-get-names).No entanto, encontrar esses quatro novos elementos
mentos exigiam o trabalho de no mínimo cem cientistas usando IA avançada
(verhttps://www.wired.com/2016/01/smashing-new-elements-into-existence-
fica-muito-mais-difícil-daqui/)porque normalmente duram uma fração de segundo em
um ambiente de laboratório. Curiosamente, o espaço pode fornecer um ambiente no
qual esses novos elementos existam naturalmente, em vez de uma fração de segundo,
porque os prótons no núcleo se repelem.
Como esta história mostra, ainda estamos encontrando novos elementos para adicionar à
tabela periódica, e o espaço certamente fornecerá ainda mais. Supernovas e outros fenômenos
espaciais podem ajudar a replicar elementos que os cientistas criam usando partículas
aceleradores ou reatores (http://discovermagazine.com/2014/sept/3-ask-
descobrir).Na verdade, os físicos de partículas usam IA em seus trabalhos desde a década de 1980.
(verhttp://www.sciencemag.org/news/2017/07/ai-change-how-we-do-
ciência-obter-vislumbre).Você pode se surpreender ao saber que já encontramos um
elemento, tecnécio, apenas no espaço (https://www.forbes.com/sites/
ethansiegel/2015/08/01/a-periodic-table-surprise-the-one-element-instars-that-isnt-
on-earth/#42928c04df74).
A combinação dos elementos fornece novos materiais. A IA também é diretamente responsável por ajudar os
químicos a encontrar novas maneiras de combinar elementos em novos e interessantes cristais.
tals (verhttps://www.sciencedaily.com/releases/2016/09/160921084705.
htm).Em um caso, os cientistas descobriram 2 milhões de novos tipos de cristais usando apenas
quatro elementos, mas essas descobertas dependiam do uso de IA. Imagine o que acontecerá no
futuro quando os cientistas começarem a abrir as portas para a IA e o aprendizado profundo (que
serão capazes de determinar se os cristais resultantes são realmente úteis).
Melhorando a comunicação
Qualquer empreendimento no espaço tão complexo quanto a mineração requer o uso de
comunicações avançadas. Mesmo que as sondas e os robôs usados para mineração incluam
capacidade de aprendizado profundo para lidar com a maioria dos incidentes menores e alguns
dos principais que ocorrerão durante o processo de mineração, os humanos ainda precisarão
resolver problemas que a IA não consegue. Esperar horas apenas para descobrir que existe um
problema e depois gastar ainda mais horas tentando determinar a origem do problema
significará um desastre para a mineração baseada no espaço. Comunicação manual atual
O espaço é vasto. É improvável que os humanos explorem tudo isso. Qualquer um que diga a você
que todas as fronteiras se foram obviamente não olhou para o céu. Mesmo os autores de ficção
científica parecem pensar que o universo continuará a ter lugares a serem explorados pelos humanos.
Claro, se você gosta da teoria do multiverso (https://www.space.com/18811-
múltiplos-universos-5-teorias.html),o número de lugares para explorar pode ser
infinito. O problema nem é encontrar um lugar para ir; em vez disso, é descobrir qual
lugar ir primeiro. As seções a seguir ajudam você a entender o papel da IA em mover as
pessoas do planeta Terra para outros planetas e depois para as estrelas.
As sondas hoje não estão apenas tentando alcançar algum local. Quando chegam ao local,
executam tarefas complexas e, em seguida, transmitem por rádio os resultados dessas tarefas.
Não é preciso muito para imaginar a vasta quantidade de informações que sondas
individuais, como o Curiosity, geram. Apenas analisar os dados do Curiosity requer a
mesma análise de big data usada por organizações como Netflix e Goldman Sachs
(verhttps://www.forbes.com/sites/bernardmarr/2016/04/14/amazing-bigdata-at-
nasa-real-time-analytics-150-million-miles-from-
terra/#2f5350d35cc4).A diferença é que o fluxo de dados vem de Marte, não de usuários
locais, então qualquer análise de dados deve considerar o tempo necessário para
realmente obter as informações. Na verdade, o atraso de tempo entre a Terra e Marte é
de até 24 minutos. Com isso em mente, o Curiosity e outras sondas devem pensar em
eles mesmos (https://www.popsci.com/artificial-intelligence-curiosity-
Andarilho)mesmo quando se trata de realizar certos tipos de análise.
• Lua
• Marte
• Europa
• Encélado
• Ceres
• Titã
Todos esses candidatos em potencial vêm com requisitos especiais que a IA pode ajudar a
resolver. Por exemplo, colonizar a lua requer o uso de cúpulas. Além disso, os colonos devem ter
uma fonte de água - água suficiente para se dividir em oxigênio para respirar e hidrogênio para
usar como fonte de calor. Assim, as sondas fornecerão algumas informações, mas modelar o
ambiente de colonização exigirá tempo e muito poder de processamento aqui na Terra antes que
os humanos possam se mudar para algum outro local.
O caso de amor humano com Marte começou em outubro de 1960, quando a União Soviética
lançou Marsnik 1 e Marsnik 2. Infelizmente, nenhuma das sondas chegou à órbita da Terra,
muito menos a Marte. Os EUA tentaram a seguir, com a espaçonave Mariner 3 em 1964 e a
espaçonave Mariner 4 em 1965. O sobrevoo da Mariner 4 conseguiu enviar 12 fotos do planeta
vermelho de volta à Terra. Desde aquela época, os humanos enviaram uma miríade de sondas
para Marte e uma série de robôs também, e os robôs estão começando a revelar os segredos
de Marte. (A taxa de sucesso para viagens a Marte, no entanto, é
menos de 50 por cento, de acordo comhttps://www.space.com/16777-curiosity-
rover-many-mars-missions.html.)Além de sondas projetadas para sobrevoar e observar
Marte do espaço, os robôs pousam em Marte de duas formas:
À medida que os landers e rovers se tornam mais capazes, a necessidade de IA aumenta. Por
exemplo, o Curiosity possui uma IA relativamente complexa que o ajuda a escolher novos alvos para
exploração de forma autônoma, conforme descrito emhttp://www.astronomy.com/news/
2016/08/how-does-mars-rover-curiositys-new-ai-system-work.não entenda
a ideia, porém, de que essa IA está substituindo os cientistas na Terra. Os cientistas ainda
determinam as propriedades das rochas que a IA irá procurar quando for usada. Além
disso, um cientista pode substituir a IA e escolher um alvo diferente. A IA existe para
ajudar, não substituir, o cientista e fornece um exemplo de como as pessoas e a IA
trabalharão juntas no futuro.
A NASA tem planos para Marte. Uma visita humana real a Marte provavelmente terá
esperar até a década de 2030 (https://www.nasa.gov/content/journey-to-mars-
visão geral).Como você pode imaginar, ciência de dados, IA, aprendizado de máquina e
aprendizado profundo terão destaque em qualquer esforço para chegar a Marte. Devido
à distância e ao ambiente, as pessoas precisarão de muito apoio para viabilizar um pouso
em Marte. Além disso, voltar de Marte será consideravelmente mais difícil do que voltar
da Lua. Até a decolagem será mais difícil por causa da presença de alguma atmosfera e
maior gravidade em Marte.
Apenas visitar o espaço não será suficiente em algum momento. A realidade das viagens
espaciais é que tudo está localizado tão longe de tudo que precisamos de pontos de
passagem entre os destinos. Mesmo com pontos de referência, a viagem espacial exigirá
muito esforço. No entanto, os waypoints são importantes até hoje. Imagine que as
pessoas realmente comecem a minerar a lua. Ter um depósito na órbita próxima da Terra
será um requisito devido ao imenso custo de remover equipamentos de mineração e
outros recursos da superfície da Terra. Obviamente, a viagem reversa também deve
acontecer para levar os recursos extraídos e os produtos acabados do espaço para a
Terra. As pessoas também vão querer tirar férias no espaço, e os cientistas já contam
com várias estruturas para continuar suas investigações.
Seja o que for que o futuro reserve, as pessoas acabarão indo parar no espaço por vários
motivos, incluindo férias. Você deve contar com o custo tão astronômico quanto sua distância
da Terra. As viagens espaciais não serão baratas no futuro previsível. De qualquer forma, as
empresas estão trabalhando em férias espaciais agora, mas você ainda não pode tirar uma.
Industrializando o espaço
Tornar as viagens espaciais pagas vem de várias formas. Os humanos já desfrutam de
benefícios consideráveis de tecnologias desenvolvidas para voos espaciais e adotadas para
uso civil aqui na Terra. (Apenas um dos muitos artigos que enfatizam a importância do espaço
para a vida aqui na Terra está emhttps://www.nasa.gov/press-release/spinoff-2016-
highlights-space-technologies-used-in-daily-life-on-earth.)
Porém, mesmo com as transferências de tecnologia, o espaço ainda é muito caro, e um retorno
melhor poderia ocorrer adaptando o que sabemos de outras formas, como por exemplo
criando fábricas espaciais (https://www.popsci.com/factories-in-space).
Na verdade, podemos descobrir que as fábricas espaciais fornecem a única maneira de produzir
certos materiais e produtos (verhttps://www.fastcodesign.com/3066988/ mit-invented-
the-material-well-need-to-build-in-spacecomo um exemplo).
Ter um ambiente de gravidade zero afeta como os materiais reagem e se combinam,
As pessoas acabarão armazenando alguns itens no espaço, e isso faz sentido. À medida que as
viagens espaciais se tornam mais prevalentes e os humanos começam a industrializar o espaço; a
necessidade de armazenar itens como combustível e materiais extraídos aumentará. Como as pessoas
não saberão onde os materiais extraídos serão usados (fábricas espaciais também exigirão
materiais), manter os materiais no espaço até que ocorra a necessidade deles na Terra será realmente
menos dispendioso do que armazená-los na Terra. O posto de gasolina espacial pode realmente
aparecer mais cedo do que você pensa, porque podemos precisar dele como parte de nosso
busca para visitar Marte (https://futurism.com/a-gas-station-in-space-couldallow-us-
to-reach-other-worlds/ehttps://www.smithsonianmag.com/inovation/nasa-sending-
robotic-fueling-station-space-180963663/).
Capítulo17
Adicionando NewHuman
Ocupações
C
uando as pessoas veem notícias sobre robôs e outras automatizações criadas
por avanços na tecnologia, como IA, elas tendem a ver mais o negativo do que
o positivo. Por exemplo, o artigo emhttps://www.theverge.
com/2017/11/30/16719092/automation-robots-jobs-global-800-million-
previsãoafirma que o uso da automação custará entre 400 milhões e 800 milhões de
empregos até 2030. Em seguida, conta como esses empregos desaparecerão. Embora o
artigo admita que alguns avanços tecnológicos criam empregos (por exemplo, o
computador pessoal criou cerca de 18,5 milhões de empregos), o foco está em todos os
empregos perdidos e no potencial para que a perda se torne permanente (como
supostamente se tornaram no setor industrial). O problema é que a maioria desses
artigos é bem definida quando se trata de perda de empregos, mas nebulosa, na melhor
das hipóteses, quando se fala em criação de empregos. O objetivo geral deste capítulo é
eliminar o exagero, a desinformação e o medo absoluto com algumas notícias melhores.
Este capítulo examina novas e interessantes ocupações humanas. Mas primeiro, não presuma que seu
emprego está em jogo. (Consulte o Capítulo 18 para ver apenas alguns exemplos de ocupações
seguras com IA.) A menos que você esteja envolvido em algo incrivelmente simples e extremamente
repetitivo, é improvável que uma IA o substitua. Muito pelo contrário, você pode descobrir que uma IA
o aprimora, permitindo que você obtenha mais prazer em sua ocupação. Mesmo assim, depois de ler
este capítulo, você pode decidir obter um pouco mais de educação e algum treinamento profissional
em alguma ocupação verdadeiramente nova e surpreendente.
Algumas das ideias que as pessoas estão discutindo sobre a vida no espaço hoje não parecem
viáveis, mas eles levam essas ideias muito a sério e, teoricamente, são possíveis. Por exemplo,
depois que a magnetosfera de Marte for restaurada, deve ser possível terraformar o planeta
para torná-lo bastante habitável. (Existem muitos artigos sobre este
tema; aquele emhttps://futurism.com/nasa-were-going-to-try-and-makeoxygen-from-
the-atmosphere-on-mars/discute como poderíamos possivelmente
forneça um ambiente de oxigênio.) Algumas dessas mudanças aconteceriam automaticamente;
outros exigiriam intervenção nossa. Imagine como seria fazer parte de uma equipe de
terraformação. Para fazer empreendimentos como esse funcionar, porém, os humanos
dependerão fortemente de IAs, que podem realmente ver coisas que os humanos não podem e
reagir de maneiras que os humanos nem conseguem imaginar hoje. Humanos e IAs
trabalharão juntos para remodelar lugares como Marte para atender às necessidades
humanas. Mais importante, esses esforços exigirão um grande número de pessoas aqui na
Terra, na Lua, no espaço e em Marte. A coordenação será essencial.
À medida que a IA e os humanos se tornam mais capazes, alguns dos lugares mais hostis para
construir se tornam mais acessíveis. Teoricamente, podemos eventualmente construir habitats
em um vulcão, mas certamente existem alguns locais mais ideais do que esse para construir
antes disso. As seções a seguir examinam apenas alguns dos lugares mais interessantes que os
humanos podem eventualmente usar como localizações para cidades. Todos esses novos locais
oferecem vantagens que os humanos nunca tiveram antes - oportunidades para expandirmos
nosso conhecimento e capacidade de viver em lugares ainda mais hostis no futuro.
As cidades subaquáticas também são bastante viáveis, e uma série de pesquisas subaquáticas
laboratórios existentes atualmente (http://www.bbc.com/future/story/20130930-can-we-
construir-cidades-subaquáticas).Nenhum desses laboratórios de pesquisa está em águas
realmente profundas, mas mesmo a 60 pés de profundidade, eles estão bem abaixo. Segundo
várias fontes, existe tecnologia para construir cidades maiores, mais abaixo, mas elas exigiriam
um monitoramento melhor. É aí que a IA provavelmente entrará em ação. A IA poderia
monitorar a cidade subaquática da superfície e fornecer os recursos de segurança que tal
cidade exigiria.
É importante considerar que cidades no oceano podem não se parecer em nada com cidades
em terra. Por exemplo, alguns arquitetos querem construir uma cidade subaquática perto de
Tóquio que se pareça com uma espiral gigante (http://www.businessinsider.com/
cidade subaquática-tokyo-japan-2017-1).Esta espiral pode abrigar até 5.000
pessoas. Esta cidade em particular ficaria a 16.400 pés abaixo do oceano e contaria com
tecnologias avançadas para fornecer coisas como energia. Seria uma cidade completa,
com laboratórios, restaurantes e escolas, por exemplo.
Não importa como as pessoas acabem se mudando para o oceano, a mudança exigirá o
uso extensivo de IA. Parte dessa IA já está em fase de desenvolvimento (http://news.
mit.edu/2017/unlocking-marine-mysteries-artificial-intelligence-1215)
Para algumas organizações, os habitats baseados no espaço não são tanto um meio de aprimorar a
exploração, mas sim de proteger a civilização. Neste momento, se um asteroide gigante impactar a
Terra, a maior parte da humanidade perecerá. As pessoas na Estação Espacial Internacional (ISS)
podem sobreviver, no entanto - pelo menos, se o asteróide não a atingir também. No entanto, a ISS
não é uma estratégia de sobrevivência de longo prazo para humanos, e o número de pessoas na ISS a
qualquer momento é limitado. Então, pessoas como o Life-
Fundação de barco (https://lifeboat.com/ex/spacehabitats)estão olhando para
habitats espaciais como um meio para garantir a sobrevivência da humanidade. Sua primeira
tentativa de um habitat espacial é Ark I (https://lifeboat.com/ex/arki),que é projetado para
1.000 residentes permanentes e até 500 convidados. Teoricamente, a tecnologia pode
funcionar, mas exigirá muito planejamento.
criamos a IA será diferente dependendo de onde vamos e quando. As pessoas atualmente têm a ideia de que
Usar recursos da lua existentes para construir moradias também é uma possibilidade. A
recente descoberta de estruturas lunares adequadas para usos de colonização facilitaria a
construção de bases na lua. Por exemplo, você pode ler sobre uma enorme caverna que está
adequado para colonização emhttp://time.com/4990676/moon-cave-base-lunar-
exploração de colônias/.Neste caso, o Japão descobriu o que parece ser um tubo de lava
que protegeria os colonos de uma variedade de ameaças ambientais.
Uma IA pode tornar um ser humano mais eficiente de várias maneiras diferentes. A maioria dos
capítulos deste livro tem algum tipo de exemplo de um humano contando com uma IA para
fazer as coisas com mais eficiência. Um dos capítulos mais interessantes, porém, é o Capítulo 7,
que aponta como uma IA ajudará nas necessidades médicas de várias maneiras. Todos esses
usos de uma IA pressupõem que um humano permanece no comando, mas usa a IA para
melhorar a execução de uma tarefa. Por exemplo, o Sistema Cirúrgico da Vinci não substitui o
cirurgião; simplesmente torna o cirurgião capaz de realizar a tarefa com maior facilidade e
menos possibilidade de erros. Uma nova ocupação que acompanha esse esforço é um
treinador que mostra aos profissionais como usar novas ferramentas que incluem uma IA.
Ao lidar com a eficiência humana, você deve pensar nas áreas em que uma IA pode se destacar. Por
exemplo, uma IA não funcionaria bem em uma tarefa criativa, então você deixa a criatividade para um
ser humano. No entanto, uma IA executa pesquisas excepcionalmente bem, então você pode treinar
um humano para confiar em uma IA para realizar tarefas relacionadas à pesquisa enquanto o humano
faz algo criativo. Aqui estão algumas maneiras pelas quais você pode ver humanos usando uma IA
para se tornarem mais eficientes no futuro:
»Contratando:Atualmente, uma pessoa que contrata pessoas para uma organização pode não saber tudo
as credenciais reais e a história do candidato. Uma IA pode pesquisar candidatos
antes de uma entrevista para que o contratante tenha mais informações para usar
durante a entrevista. Além disso, como a IA usaria a mesma metodologia de
pesquisa para todos os candidatos, a organização pode garantir que cada
candidato seja tratado de forma justa e igualitária. O artigo emhttps://www.
forbes.com/sites/georgenehuang/2017/09/27/why-ai-doesnt-meantaking-the-
human-out-of-human-resources/#41767af81ea6fornece detalhes adicionais
sobre esta tarefa específica. A empresa de bens de consumo Unilever também está
usando essa tecnologia, conforme descrito emhttp://www. businessinsider.com/
unilever-artificial-intelligence-hiringprocess-2017-6.
»Ajuda adaptável:Qualquer pessoa que use produtos hoje em dia terá que admitir que ter que
lembrar como executar uma determinada tarefa é incrivelmente frustrante às vezes, especialmente
quando redescobrir como executar a tarefa requer o uso da ajuda do aplicativo. Você já pode ver
como uma IA se torna uma ajuda adaptativa quando se trata de digitar certos tipos de informações
em formulários. No entanto, uma IA poderia ir muito mais longe. Ao usar técnicas de aprendizado de
máquina para descobrir padrões de uso, uma IA poderia eventualmente fornecer ajuda adaptativa
que ajudaria os usuários a superar as partes difíceis de lembrar de um aplicativo. Como cada usuário
é diferente, um aplicativo programado para fornecer ajuda adaptável nunca funcionaria. O uso do
aprendizado de máquina permite que as pessoas personalizem o sistema de ajuda para atender a
cada usuário individual.
»Aprendizagem adaptativa:Hoje você pode fazer um exame adaptativo que se adapta para perguntar
perguntas sobre pontos fracos percebidos em seu conhecimento. O exame adaptativo
descobre que você realmente sabe o suficiente ou faz perguntas suficientes para garantir que
você precisa de mais treinamento. Eventualmente, os aplicativos serão capazes de detectar
como você os usa e, em seguida, fornecer treinamento automatizado para torná-lo melhor.
Por exemplo, o aplicativo pode descobrir que você pode executar uma tarefa usando cinco
cliques a menos, para mostrar como executar a tarefa usando essa abordagem. Ao treinar
constantemente as pessoas para usar a abordagem mais eficiente ao interagir com
computadores ou realizar outras tarefas, a pessoa se torna mais eficiente, mas a necessidade
do ser humano nessa função específica permanece.
Ao longo dos anos, a previsão do tempo tornou-se muito mais confiável. Parte do motivo desse
aumento na confiabilidade são todos os sensores disponíveis. O serviço meteorológico também
criou melhores modelos meteorológicos e acumulou um armazenamento muito maior de
dados para usar em previsões. No entanto, a principal razão pela qual o boletim meteorológico
é mais preciso é o uso de IA para lidar com o processamento de números e procurar padrões
identificáveis nos dados resultantes (consultehttps://www.techemergence.
com/ai-para-previsão-do-tempo/para detalhes).
Os eventos naturais que esta seção cobriu até agora são apenas a ponta do iceberg. Se
você está tendo a ideia de que a Terra é tão complexa que nenhuma pessoa jamais
poderia entendê-la, você está certo. É por isso que precisamos criar e treinar IAs para
ajudar os humanos a entender melhor como o mundo funciona. Ao criar esse tipo de
conhecimento, pode ser possível evitar eventos catastróficos no futuro, além de reduzir
os efeitos de certos males causados pelo homem.
Não importa o que você leu, atualmente não existe nenhuma maneira de prevenir o mau
tempo, terremotos ou vulcões. O melhor que os humanos podem esperar alcançar hoje é
prever esses eventos e então agir para reduzir seu impacto. No entanto, até mesmo a
capacidade de reduzir o impacto dos eventos naturais é um grande avanço. Antes da IA, os
humanos estavam à mercê de qualquer evento que ocorresse, porque a previsão era
impossível antes que fosse tarde demais para realmente agir de maneira proativa para reduzir
os efeitos do desastre natural.
Da mesma forma, embora a prevenção de todos os desastres causados pelo homem possa parecer possível,
muitas vezes não é. Nenhuma quantidade de planejamento impedirá que acidentes aconteçam. Dito isso, a
maioria dos eventos criados pelo homem são controláveis e potencialmente evitáveis com os insights
corretos, que podem ser fornecidos por meio da correspondência de padrões que uma IA pode fornecer.
»As imagens devem aparecer na resolução correta para realmente encontrar um evento.
»Usar o filtro de luz correto é essencial porque alguns eventos se tornam visíveis
apenas na luz certa.
Além de digitalizar imagens em busca de possíveis problemas, a IA também pode aprimorar as imagens.
O artigo emhttps://www.wired.com/story/how-ai-could-really-enhance-
imagens-do-espaço/fala sobre como a IA pode aumentar a resolução e a usabilidade de
imagens tiradas do espaço. Ao aprimorar as imagens, a IA pode fazer melhores
determinações de tipos específicos de eventos com base no padrão de eventos. Claro, se
a IA não viu um padrão específico antes, ela ainda não pode fazer nenhum tipo de
previsão. Os humanos sempre precisarão verificar a IA e garantir que um evento
realmente seja o que a IA pretende que seja.
Outros eventos não requerem necessariamente uma evacuação. Por exemplo, com a tecnologia atual
e um pouco de sorte, as pessoas podem reduzir os efeitos de algo como um incêndio florestal. Na
verdade, alguns profissionais de incêndio agora estão usando IA para realmente prever
incêndios antes que ocorram (https://www.ctvnews.ca/sci-tech/artificialintelligence-
can-better-predict-forest-fires-says-alberta-
pesquisador-1.3542249).Usar IA para permitir que as pessoas vejam o problema e criem
uma solução para ele com base em dados históricos é viável porque os humanos
registraram muitas informações sobre esses eventos no passado.
Usar dados históricos para resolver problemas planetários é essencial. Ter apenas uma solução
potencial geralmente é uma má ideia. Os melhores planos para resolver um problema incluem
várias soluções, e uma IA pode ajudar a classificar as possíveis soluções com base nos
resultados históricos. Claro, aqui novamente, um ser humano pode ver algo nas soluções que
torna uma opção preferível a outra. Por exemplo, um determinado
No futuro, algumas pessoas podem se especializar em interagir com IAs para fazê-los trabalhar
melhor com os dados. Obter os resultados certos geralmente significa saber que pergunta
fazer e como fazê-la. Hoje, as pessoas geralmente obtêm resultados ruins de uma IA porque
não estão familiarizadas o suficiente com o funcionamento da IA para fazer perguntas
razoáveis sobre ela.
Os humanos que assumem que as IAs pensam de maneira humana estão fadados ao
fracasso em obter bons resultados da IA. Claro, isso é o que nossa sociedade promove
hoje. Os comerciais da Siri e da Alexa fazem a IA parecer humana, mas não é, claro. Em
caso de emergência, mesmo com uma IA acessível aos humanos que estão lidando com o
evento, os humanos devem saber fazer as perguntas apropriadas e de que forma pedir
para obter os resultados desejados. Você não pode ver o efeito de uma solução se não
souber o que esperar da IA.
Tentando novamente
A Terra é um lugar complicado. Vários fatores interagem com outros fatores de maneiras
que ninguém pode prever. Consequentemente, a solução que você criou pode não
resolver realmente um problema. Na verdade, se você ler as notícias com muita
frequência, descobrirá que muitas soluções não resolvem absolutamente nada. Tentativa
e erro ajudam as pessoas a entender o que funciona e o que não funciona. No entanto,
ao usar uma IA para reconhecer padrões de falha – as soluções que não funcionaram e
por quê – você pode reduzir o número de soluções necessárias para tentar encontrar
uma que funcione. Além disso, uma IA pode procurar cenários semelhantes para
soluções que funcionaram no passado, às vezes economizando tempo e esforço na
tentativa de encontrar novas soluções para experimentar. A IA não é uma varinha mágica
que você pode acenar para criar uma solução que funcione na primeira vez que você
tentar.
As IAs que você usa na criação de soluções acabarão ficando sem ideias, ponto em que a IA se
torna basicamente inútil. Isso porque uma IA não é criativa. Os padrões com os quais uma IA
trabalha já existem. No entanto, esses padrões podem não atender a uma necessidade atual, o
que significa que você precisa de novos padrões. Os seres humanos são adeptos da criação de
novos padrões para aplicar aos problemas. Consequentemente, tentar novamente torna-se
essencial como meio de criar novos padrões que uma IA pode acessar e usar para ajudar um
humano a se lembrar de algo que funcionou no passado. Em suma, os seres humanos são uma
parte essencial do ciclo de resolução de problemas.
»Ser criativo
»Usando a intuição
Capítulo18
Dez ocupações seguras para IA
T
seu livro passou muito tempo falando sobre como a IA e os humanos diferem e demonstrando
que os humanos não têm absolutamente nada com que se preocupar. Sim, alguns empregos
desaparecerão, mas, conforme descrito no Capítulo 17, o uso da IA na verdade criará uma
grande quantidade de novos empregos — a maioria deles muito mais interessantes do que trabalhar
em uma linha de montagem. Os novos empregos que os humanos terão dependem das áreas de
inteligência (conforme descrito no Capítulo 1) que uma IA simplesmente não consegue dominar. Na
verdade, a incapacidade da IA de dominar tantas áreas do pensamento humano manterá muitas
pessoas em suas ocupações atuais, que é o objetivo deste capítulo.
Você pode descobrir que sua ocupação atual é segura para IA quando ela se enquadra em
categorias específicas, sendo a interação humana, a criatividade e o uso da intuição os mais
prevalentes. No entanto, este capítulo aborda apenas a ponta do iceberg. Temer
comércio por certos indivíduos (verhttps://www.theinquirer.net/inquirer/news/
3013919/elon-musk-spews-more-ai-fear-mongering-is-desperate-
lance para mais atenção da mídia)tem pessoas preocupadas que seu trabalho vá embora
amanhã. A propagação do medo também impedirá que as pessoas usem todo o potencial de
IA para facilitar a vida deles (consultehttps://www.cnbc.com/2017/09/21/head-
ofgoogle-ai-slams-fear-mongering-about-the-future-of-ai.html).o geral
A mensagem deste capítulo é esta: Não tenha medo. AI é uma ferramenta que, como qualquer outra
ferramenta, é projetada para tornar sua vida mais fácil e melhor.
Ensinar crianças
Passe algum tempo em uma escola primária e observe os professores pastorearem as crianças.
Você ficará surpreso. De alguma forma, os professores conseguem levar todas as crianças do
ponto A ao ponto B com um mínimo de confusão, aparentemente por pura força de vontade.
Mesmo assim, uma criança precisará de um nível de atenção enquanto outra criança precisa de
outro nível. Quando as coisas dão errado, o professor pode acabar tendo que lidar com vários
problemas ao mesmo tempo. Todas essas situações sobrecarregariam uma IA hoje porque
uma IA depende da interação humana cooperativa. Pense por um minuto na reação que Alexa
ou Siri teriam diante de uma criança teimosa (ou tente simular tal reação com sua própria
unidade). Simplesmente não vai funcionar. Uma IA pode, no entanto, ajudar um professor
nessas áreas:
»Avaliando papéis
»Usando software educacional adaptativo
»Aprimorando os cursos com base nos padrões dos alunos
»Fornecer aos alunos tutores
»Mostrar aos alunos como encontrar informações
»Criando um ambiente seguro para aprendizado por tentativa e erro
»Ajudar a orientar os alunos na tomada de decisões sobre os cursos a seguir e
atividades depois da escola para fazer com base em seu conjunto de habilidades
Enfermagem
Um robô pode levantar um paciente, salvando as costas de uma enfermeira. No entanto, uma IA não pode
tomar uma decisão sobre quando, onde e como levantar o paciente porque não pode julgar corretamente
todas as entradas não-verbais necessárias do paciente ou entender a psicologia do paciente,
O uso de AIs sem dúvida aumentará na profissão médica, mas esses usos são
extremamente específicos e limitados. O Capítulo 7 oferece algumas boas ideias sobre
onde uma IA pode ajudar na área médica. Poucas dessas atividades têm algo a ver com a
interação humana. Eles estão mais na linha de aumento humano e coleta de dados
médicos.
Você pode pensar que sua IA é uma companhia perfeita. Afinal, ele nunca responde, está
sempre atento e nunca troca você por outra pessoa. Você pode dizer a ele seus pensamentos
mais profundos e ele não vai rir. Na verdade, uma IA como Alexa ou Siri pode muito bem ser a
companhia perfeita, como retratado nos filmes.Dela(https://www.amazon.com/
exec/obidos/ASIN/B00H9HZGQ0/datacservip0f-20/).O único problema é que
uma IA na verdade não é uma companhia muito boa. O que ele realmente faz é fornecer
voz a um aplicativo de navegador. Antropomorfizar a IA não a torna real.
O problema de ter uma IA voltada para necessidades pessoais é que ela não entende o
conceito de necessidade pessoal. Uma IA pode procurar uma estação de rádio, encontrar
um artigo de notícias, fazer compras de produtos, marcar uma consulta, avisar quando é
hora de tomar remédios e até mesmo acender e apagar as luzes. No entanto, ele não
pode lhe dizer quando um pensamento é realmente uma má ideia e provavelmente lhe
causará muitos problemas. Para obter informações úteis em situações que não oferecem
regras a serem seguidas, e a pessoa que fala com você precisa de experiência da vida real
para apresentar qualquer coisa que se aproxime de uma resposta, você realmente
precisa de um humano. É por isso que pessoas como conselheiros, médicos, enfermeiras
e até aquela senhora com quem você conversa no café são necessárias. Algumas dessas
pessoas são pagas monetariamente e outras dependem apenas de você para ouvi-las
quando precisam de ajuda.
Pessoas com necessidades especiais requerem um toque humano. Muitas vezes, a necessidade especial acaba
por ser um dom especial, mas apenas quando o cuidador a reconhece como tal. Alguém com uma
necessidade especial pode ser totalmente funcional em todos os aspectos, exceto em um – é preciso
criatividade e imaginação para descobrir os meios para superar o obstáculo. Encontrar um
Uma IA pode ajudar pessoas com necessidades especiais de maneiras específicas. Por
exemplo, um robô pode ajudar alguém a realizar sua terapia ocupacional ou física para se
tornar mais móvel. A paciência absoluta do robô garantiria que a pessoa recebesse a
mesma ajuda imparcial todos os dias. No entanto, seria necessário um ser humano para
reconhecer quando a terapia ocupacional ou física não está funcionando e requer uma
mudança.
Ajudar com problemas de desenvolvimento é uma área em que uma IA, não importa o quão
bem programada e treinada, pode realmente ser prejudicial. Um humano pode ver quando
alguém está exagerando, mesmo quando parece ter sucesso em várias tarefas. Uma série de
mensagens não-verbais ajudam, mas também é uma questão de experiência e intuição,
qualidades que uma IA não pode fornecer em abundância porque algumas situações exigiriam
que a IAextrapolar(estender seu conhecimento a uma situação desconhecida) ao invés de
interpolar(usar o conhecimento entre dois pontos bem conhecidos) para ter sucesso.
Resumindo, os humanos não apenas terão que monitorar uma pessoa que eles e a IA estão
ajudando, mas também precisarão monitorar a IA para garantir que ela funcione conforme o
previsto.
inventando
Quando as pessoas falam sobre inventores, elas pensam em pessoas como Thomas Edison,
que detinha 2.332 patentes em todo o mundo (1.093 somente nos Estados Unidos) por seu
invenções (http://www.businessinsider.com/thomas-edisons-inventions-
2014-2).Você ainda pode usar uma de suas invenções, a lâmpada, mas muitas de suas
Sim, cada uma dessas pessoas se inspirou em outras fontes, mas a ideia foi realmente delas. A
questão é que as pessoas inventam coisas o tempo todo. Você pode encontrar milhões e
milhões de ideias na Internet, todas criadas por pessoas que simplesmente viram algo de uma
maneira diferente. Na verdade, as pessoas se tornarão mais inventivas à medida que tiverem
tempo para fazê-lo. Uma IA pode libertar as pessoas do mundano para que possam fazer o que
as pessoas fazem de melhor: inventar ainda mais coisas novas.
Ser artístico
Estilo e apresentação fazem um Picasso (https://www.pablopicasso.org/)dif-
diferente de um Monet (https://www.claudemonetgallery.org/).Os humanos podem dizer
a diferença porque vemos os padrões nos métodos desses artistas: tudo, desde a escolha
da tela à pintura, ao estilo de apresentação e aos tópicos exibidos. Uma IA também pode
ver essas diferenças. Na verdade, com a maneira precisa pela qual uma IA pode realizar
análises e a maior seleção de sensores à sua disposição (na maioria dos casos), uma IA
provavelmente pode descrever os padrões de arte melhor do que um ser humano e
imitar esses padrões na saída. que o artista nunca forneceu. No entanto, a vantagem da
IA termina aqui.
Uma IA se apega ao que sabe, mas os humanos experimentam. Na verdade, você pode
encontrar 59 exemplos de experimentação humana emhttps://www.pinterest.com/
aydeeyai/arte-feita-com-materiais-ou-métodos-não-tradicionais/com apenas
materiais sozinhos. Apenas um humano pensaria em criar arte a partir de arame
(https://www.pinterest.com/pin/491947959277129127/)ou folhas (https://
www.pinterest.com/pin/451697037596827773).Se um material estiver disponível, alguns
alguém criou arte a partir dele - arte que uma IA nunca poderia reproduzir.
Imaginando o irreal
Os seres humanos ampliam constantemente o envelope do que é real, tornando possível
o irreal. Ao mesmo tempo, ninguém pensou que os humanos voariam inventando
máquinas mais pesadas que o ar. Na verdade, os experimentos tendiam a apoiar a teoria
de que até mesmo tentar voar era uma tolice. Então vieram os irmãos Wright (http://
www.history.com/topics/inventions/wright-brothers).Seu voo em Kitty
Hawk mudou o mundo. No entanto, é importante perceber que o Wright
Investigando crime
Se você assiste a dramas policiais fictícios na televisão, sabe que o investigador geralmente encontra
um pequeno fato que abre todo o caso, tornando-o solucionável. A solução de crimes do mundo real
funciona de maneira diferente. Os detetives humanos contam com conhecimento totalmente
quantificável para realizar sua tarefa e, às vezes, os criminosos também facilitam demais o trabalho.
Procedimentos e políticas, aprofundando os fatos e gastando horas apenas olhando para todas as
evidências desempenham papéis importantes na resolução do crime. No entanto, às vezes um
humano dá aquele salto ilógico que de repente faz com que todas as peças aparentemente não
relacionadas se encaixem.
O trabalho de um detetive envolve lidar com uma ampla gama de questões. Na verdade,
algumas dessas questões nem envolvem atividades ilegais. Por exemplo, um detetive
pode simplesmente estar procurando por alguém que parece estar desaparecido. Talvez
a pessoa até tenha um bom motivo para não querer ser encontrada. O ponto é que
muitas dessas detecções envolvem olhar para os fatos de maneiras que uma IA nunca
pensaria em olhar porque requer um salto – uma extensão de inteligência que não existe
para uma IA. A frase,pensando fora da caixa,vem à mente.
Algumas questões essenciais estão envolvidas com AN, a primeira delas é que todos os
programas, mesmo aqueles que suportam IA, rodam em processadores cuja única capacidade
é executar as funções matemáticas e lógicas mais simples. O fato de a IA funcionar tão bem
quanto o hardware atualmente disponível é nada menos que incrível.
Capítulo19
Dez Substanciais
Contribuições da IA
para a sociedade
T
este livro ajuda você a entender a história da IA, onde está hoje e para onde
poderá ir amanhã. No entanto, uma tecnologia é útil apenas enquanto faz algum
tipo de contribuição substancial para a sociedade. Além disso, a contribuição deve
vir com um forte incentivo financeiro, ou os investidores não contribuirão para ela.
Embora o governo possa contribuir com uma tecnologia que considera útil para fins
militares ou outros por um curto período de tempo, a saúde tecnológica de longo prazo
depende do apoio do investidor. Consequentemente, este capítulo enfoca os
componentes de IA que são úteis hoje, o que significa que eles estão fazendo uma
contribuição substancial para a sociedade agora.
Algumas pessoas dizem que a promessa exagerada dos benefícios da IA hoje pode causar outro
AI inverno amanhã (https://codeahoy.com/2017/07/27/ai-winter-is-
chegando/).Além disso, a propagação do medo por certas pessoas influentes está causando
pessoas a repensar o valor da IA (https://www.theinquirer.net/inquirer/news/
3013919/elon-musk-spews-more-ai-fear-mongering-is-desperate-
licitação para mais atenção da mídia).Ambos os problemas são combatidos por outros que
acham que o potencial para um inverno de IA é pequeno (https://www.technologyreview.
Você pode se perguntar sobre o valor potencial do uso de próteses ativas em vez de passivas.
Fornecedores médicos já estão fazendo a pesquisa (veja alguns resultados no relatório
nohttps://www.rand.org/pubs/research_reports/RR2096.html).Acontece que
que as próteses baseadas em microprocessadores que dependem de uma IA para garantir que o dispositivo
interaja adequadamente com o usuário são uma grande vitória. Não só as pessoas que usam ativos
Administrar medicamentos
Pessoas doentes que se esquecem de tomar seus remédios custam muito dinheiro ao
estabelecimento médico. De acordo com este artigo da CNBC.com (https://www.
cnbc.com/2016/08/03/patients-skipping-meds-cost-290-billion-per-
ano-pode-pílulas-inteligentes-ajuda.html),o custo só nos Estados Unidos é de US$ 290
bilhões por ano. Combinando tecnologias como Near Field Communication
(NFC) (https://www.nfcworld.com/2015/11/18/339766/nxp-launches-nfcblister-packs-
and-pill-bottles-for-medication-tracking/)com aplicativos que
confiar em uma IA, você pode rastrear como as pessoas tomam seus medicamentos e quando.
Além disso, a IA pode ajudar as pessoas a lembrar quando tomar medicamentos, quais tomar e
quanto usar. Quando associado ao monitoramento, mesmo pessoas com necessidades
especiais de monitoramento podem obter a dose certa de seus medicamentos (https://
clinictrials.gov/ct2/show/NCT02243670).
As pessoas dirigem uma tonelada de pequenas vendas. No entanto, quando você pensa sobre
o poder de compra de um indivíduo, ele empalidece em comparação com o que apenas uma
organização pode gastar. A diferença está na quantidade. No entanto, os investidores olham
para ambos os tipos de vendas porque ambos geram dinheiro – muito dinheiro. As soluções
industriais afetam as organizações. Eles tendem a ser caros, mas a indústria os utiliza para
aumentar a produtividade, a eficiência e, acima de tudo, a receita. É tudo sobre a linha de
fundo. As seções a seguir discutem como a IA afeta os resultados das organizações que usam
as soluções fornecidas.
Enquanto isso, a indústria usa a impressão 3D para atender a todos os tipos de demandas. Adicionar
uma IA à mistura permite que o dispositivo crie uma saída, veja o que criou e aprenda com
seus erros (https://www.digitaltrends.com/cool-tech/ai-build-wantsto-change-the-
way-we-build-the-future/).Isso significa que a indústria
eventualmente será capaz de criar robôs que corrigem seus próprios erros - pelo menos
até certo ponto, o que reduzirá os erros e aumentará os lucros. A IA também ajuda a
reduzir o risco associado à impressão 3D por meio de produtos como Business Case
(https://www.sculpteo.com/blog/2017/08/10/the-artificial-intelligence-foryour-3d-
printing-projects-business-case/).
O preço reduzido do petróleo é parte do que levou a indústria do petróleo a adotar IA,
de acordo com a Engenharia 360 (http://insights.globalspec.com/article/ 2772/the-
growing-role-of-artificial-intelligence-in-oil-and-gas).
Como a indústria do petróleo é tão avessa ao risco, o uso da IA é um bom caso de teste para
ver como outras empresas adotarão a IA. Ao revisar artigos sobre a indústria do petróleo, você
percebe que a indústria do petróleo esperou pelo sucesso nos setores de saúde, finanças e
manufatura antes de fazer seus próprios investimentos. Você pode esperar um aumento na
adoção da IA à medida que o sucesso em outros setores cresce.
Este livro abrange todos os tipos de soluções robóticas — algumas móveis, outras não. A Parte
4 do livro aborda robôs em geral, robôs voadores (que é o que os drones realmente são
quando você pensa sobre isso) e carros autônomos ou SD. Geralmente, os robôs podem lucrar
quando executam um tipo específico de tarefa, como varrer o chão (o Roomba) ou montar o
carro. Da mesma forma, os drones são geradores de dinheiro agora para empreiteiros de
defesa e, eventualmente, também se tornarão lucrativos para um número significativo de usos
civis. Muitas pessoas prevêem que o carro SD não apenas renderá dinheiro, mas também se
tornará extremamente popular (https://www.forbes.com/
sites/oliviergarret/2017/03/03/10-milhões-auto-dirigindo-carros-vai-bater-na-
estrada-até-2020-aqui-como-lucrar/).
O Capítulo 16 leva você a um passeio pelo que a IA pode potencialmente fazer no espaço.
Embora os planos para a execução dessas tarefas estejam no papel, a maioria deles é
patrocinada pelo governo, o que significa que eles oferecem uma oportunidade que pode não
necessariamente resultar em lucro. Você também encontrará alguns projetos de pesquisa
relacionados a negócios no Capítulo 16. Nesse caso, a empresa está realmente buscando
lucrar, mas pode não estar lucrando hoje. As seções a seguir olham para o espaço de outra
maneira e apontam para o que está acontecendo hoje. Atualmente, a IA está permitindo que as
empresas ganhem dinheiro trabalhando no espaço, o que dá às empresas um incentivo para
continuar investindo em IA e em projetos relacionados ao espaço.
Talvez a maior história de sucesso comercial de IA no espaço até agora seja o reabastecimento
da ISS por empresas como SpaceX e Orbital ATK (https://www.nasa.gov/
mission_pages/station/structure/launch/overview.html).A organiza-
ções ganham dinheiro com cada viagem, é claro, mas a NASA também se beneficia. Na verdade, os Estados
Unidos como um todo aproveitaram os seguintes benefícios do empreendimento:
»Aumento do uso de instalações baseadas nos EUA, como o Centro Espacial Kennedy, que
significa que o custo dessas instalações é amortizado por um longo período de tempo
As entregas espaciais são essencialmente novas. Muitos negócios baseados na Internet tiveram déficit
por anos antes de se tornarem lucrativos. No entanto, a SpaceX, pelo menos, parece estar em posição
de possivelmente ganhar dinheiro após algumas perdas iniciais (https://www.
idiot.com/investing/2017/02/05/how-profitable-is-spacex-really.aspx).
As empresas baseadas no espaço levarão tempo para atingir o mesmo impacto financeiro que
as empresas terrestres do mesmo tipo desfrutam hoje.
Infelizmente, embora algumas pessoas estejam ganhando dinheiro com este projeto hoje,
provavelmente não veremos nenhum lucro real de nossos esforços por um tempo. Ainda assim,
algumas empresas estão lucrando hoje fornecendo as várias ferramentas necessárias para projetar a
viagem. A pesquisa financia a economia.
»Compreendendo o mundo
Capítulo20
Dez maneiras em que IA
Falhou
A
Qualquer livro abrangente sobre IA deve considerar as maneiras pelas quais a IA falhou em
atender às expectativas. O livro discute essa questão em parte em outros capítulos, dando
uma visão histórica dos invernos de IA. No entanto, mesmo com essas discussões, você pode
não entender que a IA não apenas falhou em atender às expectativas estabelecidas por proponentes
excessivamente entusiasmados; não atendeu às necessidades específicas e aos requisitos básicos.
Este capítulo é sobre as falhas que impedirão a IA de se destacar e realizar as tarefas que precisamos
para alcançar plenamente os sucessos descritos em outros capítulos. Atualmente, a IA é uma
tecnologia em evolução que, na melhor das hipóteses, é parcialmente bem-sucedida.
Uma das questões essenciais que cercam a IA hoje é que as pessoas continuam
antropomorfizando-a e transformando-a em algo que não é. Uma IA aceita dados limpos
como entrada, analisa-os, encontra os padrões e fornece uma saída solicitada. Conforme
descrito nas seções deste capítulo, uma IA não entende nada, não pode criar ou descobrir
nada novo e não tem conhecimento intrapessoal, portanto não pode simpatizar com
ninguém sobre nada. A informação crítica a ser extraída deste capítulo é que uma IA se
comporta como projetada por um programador humano, e o que você geralmente
considera inteligência é apenas uma mistura de programação inteligente e grandes
quantidades de dados analisados de maneira específica. Para uma outra visão dessas e
de outras questões, confira o artigo intitulado “Fazendo as perguntas certas sobre IA”,
nohttps://medium.com/@yonatanzunger/asking-the-right-questions-
aboutai-7ed2d9820c48.
Entendimento
A capacidade de compreender é inata aos humanos, mas os IAs carecem completamente
dela. Olhando para uma maçã, um ser humano é mais do que apenas uma série de
propriedades associadas a uma imagem de um objeto. Os humanos entendem as maçãs
por meio do uso dos sentidos, como cor, sabor e sensação. Entendemos que a maçã é
comestível e fornece nutrientes específicos. Temos sentimentos por maçãs; talvez
gostemos deles e sintamos que são o fruto supremo. A IA vê um objeto que possui
propriedades associadas a ele – valores que a IA não entende, mas apenas manipula. As
seções a seguir descrevem como a falha em entender faz com que a IA como um todo
não atenda às expectativas.
A falta de compreensão do comportamento humano figura com destaque ao longo deste capítulo.
Mesmo a compreensão de um comportamento não é suficiente para replicar ou simular o
comportamento. Uma compreensão matemática formal do comportamento deve ocorrer para torná-lo
acessível a uma IA. Dado que tantos comportamentos humanos não são totalmente compreendidos, é
improvável que alguém crie um modelo matemático formal para eles tão cedo. Sem esses modelos,
uma IA não pode pensar de maneira humana ou alcançar algo que se aproxime da senciência.
A interpretação também implica a capacidade de ver além dos dados. Não é a capacidade de
criar novos dados, mas entender que os dados podem indicar algo diferente do que está
aparente. Por exemplo, os humanos muitas vezes podem dizer que os dados são falsos ou
falsificados, mesmo que os dados em si não apresentem evidências que indiquem esses
problemas. Uma IA aceita os dados como reais e verdadeiros, enquanto um humano sabe que
não é real nem verdadeiro. Formalizar precisamente como os humanos alcançam esse objetivo
é atualmente impossível porque os humanos realmente não o entendem.
O mesmo processo de conversão ocorre com todos os sentidos que os humanos possuem. Um
computador traduz visão, som, olfato, paladar e tato em representações numéricas e, em seguida,
executa correspondência de padrões para criar um conjunto de dados que simula a experiência do
mundo real. Para complicar ainda mais as coisas, os humanos geralmente experimentam as coisas de
maneira diferente umas das outras. Por exemplo, cada pessoa experimenta cores
unicamente (https://www.livescience.com/21275-color-red-blue-scientists.
html).Para uma IA, todo computador vê as cores exatamente da mesma maneira, o que
significa que uma IA não pode experimentar as cores de maneira única. Além disso, por
causa da conversão, uma IA não experimenta cor alguma.
Em muitas situações, julgar mal a capacidade de uma IA de executar uma tarefa é apenas
inconveniente. Em alguns casos, pode ser necessário executar a tarefa uma segunda ou
terceira vez manualmente porque a IA não está à altura da tarefa. No entanto, quando se trata
de consequências, você pode enfrentar problemas legais, além dos problemas morais e éticos,
se confiar em uma IA para realizar uma tarefa inadequada para ela. Por exemplo, permitir que
um carro autônomo (SD) dirija sozinho em um local que não atende a essa necessidade
provavelmente é ilegal e você enfrentará problemas legais, além de danos e despesas médicas
que o carro SD pode causa. Em suma, saiba quais são os requisitos legais antes de confiar em
uma IA para fazer qualquer coisa que envolva possíveis consequências.
descobrindo
Uma IA pode interpolar o conhecimento existente, mas não pode extrapolar o
conhecimento existente para criar um novo conhecimento. Quando uma IA encontra uma
nova situação, ela geralmente tenta resolvê-la como um conhecimento existente, em vez
de aceitar que é algo novo. Na verdade, uma IA não tem método para criar algo novo ou
vê-lo como algo único. Essas são expressões humanas que nos ajudam a descobrir coisas
novas, trabalhar com elas, criar métodos para interagir com elas e criar novos métodos
para usá-las para realizar novas tarefas ou aumentar as tarefas existentes. As seções a
seguir descrevem como a incapacidade de uma IA de fazer descobertas a impede de
atender às expectativas que os humanos têm dela.
Uma das tarefas mais comuns que as pessoas realizam éextrapolaçãoDe dados; por exemplo,
dado A, o que é B? Os seres humanos usam o conhecimento existente para criar um novo
conhecimento de um tipo diferente. Ao conhecer um pedaço de conhecimento, um humano
pode dar um salto para um novo pedaço de conhecimento, fora do domínio do conhecimento
original, com alta probabilidade de sucesso. Os humanos dão esses saltos com tanta frequência
que se tornam uma segunda natureza e intuitivos ao extremo. Mesmo as crianças podem fazer
tais previsões com uma alta taxa de sucesso.
Uma maneira básica de entender a capacidade humana de ver além dos padrões é olhar
para o céu. Em um dia nublado, as pessoas podem ver padrões nas nuvens, mas uma IA
vê nuvens e apenas nuvens. Além disso, duas pessoas podem ver coisas diferentes no
mesmo conjunto de nuvens. A visão criativa dos padrões na nuvem pode fazer com que
uma pessoa veja uma ovelha e outra uma fonte. O mesmo vale para estrelas e outros
tipos de padrões. A IA apresenta o padrão como saída, mas não entende o padrão e não
tem criatividade para fazer qualquer coisa com o padrão, exceto relatar que o padrão
existe.
Descrever a sinestesia efetivamente está muito além da maioria dos humanos. Antes que possam criar
uma IA que possa imitar alguns dos efeitos verdadeiramente surpreendentes da sinestesia, os
humanos devem primeiro descrevê-la completamente e, em seguida, criar sensores que converterão a
experiência em números que uma IA possa analisar. No entanto, mesmo assim, a IA verá apenas os
efeitos da sinestesia, não o impacto emocional. Consequentemente, um
Embora a maioria das pessoas saiba que os humanos têm cinco sentidos, muitas fontes agora
afirmam que os humanos realmente têm muito mais do que os cinco sentidos padrão.
(http://www.todayifoundout.com/index.php/2010/07/humans-have-a-lot-
mais-de-cinco-sentidos/).Alguns desses sentidos adicionais não são bem compreendidos e
dificilmente podem ser provados, comomagnetocepção(a capacidade de detectar campos
magnéticos, como o campo magnético da Terra). Esse sentido dá às pessoas a capacidade de
dizer a direção, semelhante ao mesmo sentido dos pássaros, mas em menor grau. Como não
temos um método sequer para quantificar esse sentido, é impossível replicá-lo como parte de
uma IA.
empatia
Os computadores não sentem nada. Isso não é necessariamente negativo, mas este
capítulo o vê como negativo. Sem a capacidade de sentir, um computador não pode ver
as coisas da perspectiva de um ser humano. Ele não entende estar feliz ou triste, então
não pode reagir a essas emoções, a menos que um programa crie um método para
analisar expressões faciais e outros indicadores e, então, agir adequadamente. Mesmo
assim, tal reação é uma resposta enlatada e propensa a erros. Pense em quantas
decisões você toma com base em necessidades emocionais, e não em fatos absolutos. As
seções a seguir discutem como a falta de empatia por parte de uma IA impede que ela
interaja adequadamente com os humanos em muitos casos.
Uma IA cria uma imagem sua por meio dos dados que coleta. Em seguida, ele cria padrões a
partir desses dados e, usando algoritmos específicos, desenvolve uma saída que faz com que
pareça conhecê-lo – pelo menos como um conhecido. No entanto, como a IA não sente, ela não
pode apreciá-lo como pessoa. Ele pode atendê-lo, caso você o ordene e supondo que a tarefa
esteja dentro de sua lista de funções, mas não pode ter nenhum sentimento por você.
Mudando a perspectiva
Os humanos às vezes podem mudar uma opinião com base em algo diferente dos fatos.
Mesmo que as probabilidades digam que um determinado curso de ação é prudente,
uma necessidade emocional torna preferível outro curso de ação. Uma IA não tem
preferências. Portanto, não pode escolher outro curso de ação por qualquer motivo que
não seja uma mudança nas probabilidades, umalimitação(uma regra que o força a fazer a
alteração) ou um requisito para fornecer saída aleatória.
Fazendo saltos de fé
Féé a crença em algo como sendo verdadeiro sem ter um fato comprovado para respaldar tal
crença. Em muitos casos, a fé assume a forma deconfiar,que é a crença na sinceridade de outra
pessoa sem qualquer prova de que a outra pessoa é confiável. Uma IA não pode exibir fé ou
confiança, o que é parte do motivo pelo qual ela não pode extrapolar o conhecimento. O ato de
extrapolação geralmente depende de um palpite, baseado na fé, de que algo é verdadeiro,
apesar da falta de qualquer tipo de dado para apoiar o palpite. Como uma IA carece dessa
capacidade, ela não pode exibir insight – um requisito necessário para padrões de pensamento
semelhantes aos humanos.
Índice 295
Asimov, Isaac (autor), 74, 183–184 “Fazendo dados biométricos, 25
C
B cache, 60
retropropagação, 137, 161 Bacia Caloris, 242
encadeamento reverso, 51 câmeras, 220
Banko (pesquisador), 39 apek, Karel (autor), 182–183
aprendizado em lote, 165 CareSkore, 106
Bay Labs (site), 103 CAT (tomografia axial computadorizada), 12
Bayes, Thomas (Reverendo), 144–146 Catanzaro, Bryan (pesquisador), 62
Teorema de Bayes, 19, 144–146 categorizando a inteligência artificial (IA), 12–14
Inferência Bayesiana, 138 Redes mudando a perspectiva, 293
Bayesianas, 139, 148 planejamento canais, 168
de comportamento, 216 reconhecimento de caracteres, 167–168
crença, fato separado de, como uma atividade mental, chatbot, 172–174
8 Bengio, Toshua (cientista), 140, 167, 170 Betamax, 63 folha de dicas (site), 3
damas, 46
Bezos, Jeff (CEO), 253 BFS nó filho, 42
(busca em largura), 44 viés, crianças, ensino, 272 Argumento da
35–36, 96, 137 Sala Chinesa, 72–73 Aplicativo
grandes dados, 22 ChoiceMap, 118
drones comerciais, 200–202 comissão, como uma cidades em ambientes hostis, 257–261
aprimoramento, 247–248
baseados na lua, 260–261 coisas
Índice 297
D aprendendo com dados, 132–134
aprendizado de máquina, 126–132
da Vinci Surgical System, 104, 261
deficiências de dados, como um limite de IA, 228–229
D'Andrea, Raffaello (engenheiro),
manipulação de dados, 30–33
202 Dango (site), 111
Data Never Sleeps (site), 37 registro
energia escura, 243
de dados, 31
espaço escuro, 243
espectro de dados, 117-118
DARPA (Projetos de Pesquisa Avançada de Defesa
Agência), 62–63, 186, 208 tabelas de banco de dados, 22
Índice 299
lógica de primeira ordem, 51 Google Smart Reply, 174
transformação de arquivo plano, Google Translate, 111–112
122 voo, 275–276 Google's AI (website), 111
Ford, Henry (fundador da Ford Motor Company), Google's Allo (website), 111
85, 211 Google's Home, 83
formulários, 29
MobileNets do Google, 200
encadeamento para frente, 51
Tensor Processing Unit (TPU) do Google, 63, 64
Foster, John Stuart, Jr. (físico nuclear), 196 TensorFlow do Google (site), 140, 166 GPS, 215
FPGAs (Field Programmable Gate Arrays), 64
quadro de referência, como uma inverdade sobre os dados, Graham, Bette Nesmith (inventor),
36–37
gráfico 275, 42–44
detecção de fraude
Graphcore, 64
IA para, 17
Unidades de processamento gráfico (GPUs), 59–62, 162
como um benefício do aprendizado de máquina,
gráficos, 146–150
129 Inteligência Artificial Amigável (FAI), 73–74
grupos, sugestões baseadas em, 77
automação total, como um nível de autonomia em auto-
dirigindo carros, 210
futuro, prevendo o, 106 H
lógica fuzzy, 52 habitats, terraformaçãocontra,
261 Hadoop (site), 123
Google Brain Project (site), 62 alta automação, como um nível de autonomia em auto-
dirigindo carros, 210
Google DeepMind, 53, 105, 134
otimização de subida de colina, 47-48
Google Neural Machine Translation (GNMT)
sistema, 112 Hinton, Geoffrey (cientista), 140, 161, 162, 170
eficiência dos humanos, 261–263 corrigindo “Indução de Árvores de Decisão” (Quinlan), 147,
152–154
problemas de escala planetária, 263–268 espaço,
configurações industriais, automação de processos em, 85–87
256–257
soluções industriais, desenvolvimento, 282–283 utilização
que permanecem seguros, 271–277
industrial, 81
processos humanos, processos racionaiscontra,13
espaço industrializado, 253–254
sentidos humanos, 118
Indústria 4.0, 188
percepção sensorial humana, 117–118
motor de inferência, 51
colaboração humana/IA, 236
comercial, 235–236
humanamente
informação, robôs para, 189
atuação, 12
estratégia informada, 44
pensando, 12–13
inspecionando, 123
humanóides, 186–188
Circuito Integrado (IC), 23–24, 243
humanos
inteligência, 8–11
como fonte de dados, 27, 28–29 tornando
Aumento de Inteligência (IA), 118 Unidade de
mais capaz, 95–98 quando eles fazem
Processamento de Inteligência (IPU), 64
melhor, 236 interações humanas
interagindo, com o ambiente, 65-66.Veja também
específicas, 280–281 Humbly, Clive
interação humana
(matemático), 122 Atualização do
interlíngua, 112
Hummingbird (Google), 27 espaço de
Estação Espacial Internacional (site), 239, 282
hipótese, 128
Internet, 24
Índice 301
Internet das Coisas (IoT), 25 “Cálculos locais com probabilidades em
inteligência interpessoal, 10 estruturas gráficas e sua aplicação a sistemas
especialistas,” 149–150
interpolar, 274
corte de grama, robôs para, 189
interpretando, analisandocontra,288–
Modelo LCDM (Lambda Cold Dark Matter), 242 nós
289 inteligência intrapessoal, 11
de folha, 42
introspecção, 12
saltos de fé, 293–294
decisões intuitivas, 276–277
aprendizado.Veja tambémaprendizagem profunda; aprendizado de máquina
inventando, 274–275
lote, 165
investigação de crimes, 276 IoT
ponta a ponta, 166–167
(Internet das Coisas), 25
como uma atividade mental, 8
IPU (Unidade de Processamento de Inteligência),
necessidade de, 234
64 PackBot da iRobot, 190
on-line, 165
reforço, 134
J estradas para, 136–140
Vá jogo, 53
Kálmán, Rudolf E. (engenheiro), 221–222
aprendizado de máquina, 52–53
Filtro de Kalman, 219, 221–222
LeCun, Yann (cientista), 140, 162, 164, 167,
Princípio Keep It Simple, Stupid (KISS), 237 170, 175
Kepler 90, 242 LeNet5, 167, 170
núcleo, 170 Li, Fei-Fei (professor), 170
Princípio KISS (Keep It Simple, Stupid), 237 lidar, 220
conhecimento, anterior, 143 LIDAR (telêmetro a laser), 48
base de conhecimento, 51 vida, imitando, 171–177
K'Watch, 93 Lifeboat Foundation (website), 259
memória limitada, 14
eu inteligência linguística, 11
LinkedIn, 115
Modelo Lambda Cold Dark Matter (LCDM), 242
Lippershey, Hans (fabricante de óculos), 240
lander, 250
List Processing (LisP), 16, 50
linguagem, 110, 111–112, 113
“Cálculos locais com probabilidades em
O instinto da linguagem: como a mente cria
estruturas gráficas e sua aplicação a sistemas
Linguagem(Pinker), 218
especialistas” (Lauritzen e Spiegelhalter), 149–
telêmetro a laser (LIDAR), 48 150
latência, 60, 193 pesquisa local, 46–49
Lauritzen, Steffen L. (autor) localização, 215
Índice 303
“Modelando o tédio humano no trabalho: neurônios, 156
formulações matemáticas e uma Newell, Allen (pesquisador), 232
estrutura probabilística”, 88
Ng, Andrew (pesquisador), 62
Monet (artista), 275
Nilsson, Nils J. (professor), 158
monitores
PNL (Processamento de Linguagem Natural), 173
wearable crítico, 93–94
nenhum teorema de almoço grátis, 136
móvel, 94–95
aplicativos não iniciais
vestindo, 92-93
sobre, 225
pouso na lua, 241
invernos AI, 230-234
Moon Minerology Mapper (website), 246
aplicando AI corretamente, 229
recursos baseados na lua, construção, 260–261
criando soluções, 234–237
moonquakes, 260
limites de AI, 226–229
Moore, Gordon (cofundador da Intel e Fairchild
expectativas irrealistas, 229-230
Semicondutor), 23
comunicação não-verbal, 110
Lei de Moore, 23–24
Norvig, Peter (diretor de pesquisa da
Monitor Moov, 93
Google), 49
Moravec, Hans (cientista), 218
Problemas NP-completos, 40–41
Paradoxo de Moravec, 218
enfermagem, 272–273
Mori, Masahiro (professor), 187
NVidia, 214–215
Motiv, 93
Mina do Passo da Montanha, 246
criando ambientes seguros, 88–89 Unidade Linear Retificada (ReLU), 159 Redes
desenvolvendo soluções para o tédio, 82–85 Neurais Recorrentes (RNN), 171–177 Recursão
em ambientes industriais, 85–87 Farmacêutica, 108
Índice 305
referência, quadro de, como uma inverdade sobre os dados, 36–
37 problemas de regressão, 133
S
SAE International (website), 209 questões
questões regulatórias, com drones,
de segurança, evitando, 88-89 sistemas
aprendizado por reforço 205–206, 134
de segurança
relacionamentos
IA para, 18
desenvolvendo, 293
como benefício do aprendizado de máquina, 130
vendo, como uma atividade mental, 8
SAM (Mecanismo de Aplicador de Script) (site),
confiabilidade, de dados, 28–29 ReLU 72
(Unidade Linear Retificada), 159 Ícone de “Escalonando para Corpora Muito Grandes para Natural
Lembrete, 3 Linguagem Desambiguação” (Banko e
Aeronave Remotamente Pilotada (RPA), 196 Brill), 39
agendamento
reprodutível, na sigla CREEP, 235
IA para, 18
redimensionada, 122
como benefício do aprendizado de máquina, 129
agendamento de recursos
usando IA para, 262
IA para, 18
como benefício do aprendizado de máquina,
investigação científica, realizando, 253
Índice 307
gostos, 65
ensinando crianças, 272
você
UACV (veículos de combate aéreo não tripulados), 196 UAS
Ícone de material técnico, 3 ambientes de
(sistema de aeronaves não tripuladas), 196
tecnologia, 283–284 Tensor Processing Unit
UAV (veículos aéreos não tripulados), 196
(TPU), 63, 64 TensorFlow (website), 140, 166
sensores ultrassônicos, 221
Exterminador do Futuro(filme), 113, 204
vale misterioso, 187
terraformação, habitatscontra,261
problemas indefinidos, expectativas irrealistas
programa de cartão de fidelidade da Tesco, de, 230
122 tetracromatas, 65 entendimento
como falha de IA, 288–290
teoria da mente, 14 como atividade mental, 8
terapia, usando jogos para, cidades subaquáticas, 258
pensamento 95-97 Gráfico de emoji Unicode, 111
humanamente, 12–13 Unimate, 183
fora da caixa, 276 estratégia desinformada,
racionalmente, 13 universo 44, 240–243
países do terceiro mundo, 103 veículos de combate aéreo não tripulados (UACV), 196
Telescópio de trinta metros, 241 Gerenciamento de Tráfego de Sistemas Aéreos Não Tripulados
impressão 3-D, 282 (UTM), 206
tecnologia 3-D, 187 veículos aéreos não tripulados (UAV), 196
TPU (Tensor Processing Unit), 63, 64 UTM (Tráfego de Sistemas Aéreos Não Tripulados
Índice 309
sites(contínuo) OpenAI, 171
O jogo da imitação(filme), 55 Aumento de ATK orbital, 284–285
Inteligência (IA), 118 Unidade de Tratado do Espaço Sideral, 260
Z
Weizenbaum, Joseph (cientista), 173, 232
Welchman, Gordon (matemático), 59
Saúde Zéfiro, 106
Weller, Deutsche (autor), 197
Gravidade Zero, 253
Clareamento, 275
Índice 311
sobre os autores
João Muelleré um autor freelance e editor técnico. Tem a escrita no sangue, tendo
produzido 108 livros e mais de 600 artigos até hoje. Os tópicos variam de rede a
inteligência artificial e de gerenciamento de banco de dados a programação direta.
Alguns de seus livros atuais incluem discussões sobre ciência de dados, aprendizado de
máquina e algoritmos. Suas habilidades técnicas de edição ajudaram mais de 70 autores
a refinar o conteúdo de seus manuscritos. John forneceu serviços de edição técnica para
várias revistas, realizou vários tipos de consultoria e redigiu exames de certificação.
Certifique-se de ler o blog de John emhttp://blog. johnmuellerbooks.com/.Você pode
entrar em contato com John na Internet em John@JohnMueller
Books. com. John também tem um site emhttp://www.johnmuellerbooks.com/.
Dedicatória de Luca
Este livro é dedicado à família Suda que vive em Tóquio: Yoshiki, Takayo, Makiko e Mikiko.
Agradecimentos de João
Agradeço à minha esposa, Rebeca. Embora ela já tenha ido embora, seu espírito está em cada livro
que escrevo e em cada palavra que aparece na página. Ela acreditou em mim quando ninguém mais
acreditaria.
Russ Mullen merece agradecimentos por sua edição técnica deste livro. Ele acrescentou muito à
precisão e profundidade do material que você vê aqui. Russ está sempre me fornecendo ótimos
URLs para novos produtos e ideias. Ele também é o teste de sanidade do meu trabalho.
Matt Wagner, meu agente, merece crédito por me ajudar a conseguir o contrato em
primeiro lugar e cuidar de todos os detalhes que a maioria dos autores realmente não
considera. Eu sempre aprecio sua ajuda. É bom saber que alguém quer ajudar.
Várias pessoas leram todo ou parte deste livro para me ajudar a refinar a abordagem, testar os
exemplos de codificação e, em geral, fornecer informações que todos os leitores gostariam de
ter. Esses voluntários não remunerados ajudaram de maneiras numerosas demais para serem
mencionadas aqui. Agradeço especialmente os esforços de Eva Beattie e Osvaldo Téllez
Almirall, que forneceram informações gerais, leram o livro inteiro e se dedicaram
abnegadamente a este projeto.
Agradecimentos de Luca
Meus primeiros agradecimentos à minha família, Yukiko e Amelia, por seu apoio,
sacrifícios e paciência amorosa durante os longos dias/noites, semanas e meses em que
estive trabalhando neste livro.
Editor Sênior de Aquisições:Katie Mohr Editor de Assistente Editorial Sr.:Cherie Case Editor de
projeto e cópia:Susan Christophersen Editor Produção:Vasanth Koilraj Imagem de capa:©
Técnico:Russ Mullen Assistente editorial:Mateus Agsandrew/Shutterstock
Lowe
Leve bonecos com você
aonde quer que você vá!
Se você está entusiasmado com os e-books, quer mais da
web, deve ter seus aplicativos móveis ou é varrido
nas redes sociais, manequins torna tudo mais fácil.
Encontre-nos online!
dummies.com
Aproveite o poder
Bobosé líder global na categoria referência e uma das marcas
mais confiáveis e conceituadas do mundo. Não mais focado
apenas em livros, os clientes agora têm acesso ao conteúdo
fictício de que precisam no formato que desejam. Juntos,
criaremos uma solução que envolva seus clientes, se destaque da
concorrência e ajude você a atingir seus objetivos.
Publicidade e Patrocínios
20 MILHÃO
VISUALIZAÇÕES DE PÁGINA
TODOS OS MESES
MILHÃO
15
EXCLUSIVO
VISITANTES POR MÊS
43%
DE TODOS OS VISITANTES
700.000BOLETIMASSINATURAS
DE NOTÍCIAS
PARA AS CAIXAS DE ENTRADA DE
ACESSE O SITE
ATRAVÉS DE SEUS DISPOSITIVOS MÓVEIS
300.000EXCLUSIVO INDIVÍDUOS
TODA SEMANA
de manequins
Publicação personalizada
você dos concorrentes, amplie sua mensagem e incentive os clientes a tomar uma
decisão de compra.
DESENVOLVIMENTO PROFISSIONAL
dummies.com
Aprendizagem facilitada
ACADÊMICO
dummies.com
Pequenos livros para grandes
imaginações
dummies.com
CONTRATO DE LICENÇA DE USUÁRIO FINAL DA WILEY
Acesse www.wiley.com/go/eula para acessar o e-book EULA da Wiley.