A Evolução Do Controle Na Era Digital

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 130

REVISTA doTCU

Fiscalizao a servio da sociedade

Revista do Tribunal de Contas da Unio Brasil ano 48 nmero 137 Setembro/Dezembro 2016

A Evoluo do Controle na
Era Digital
REVISTA doTCU
Fiscalizao a servio da sociedade

Revista do Tribunal de Contas da Unio Brasil ano 48 nmero 137 Setembro/Dezembro 2016
Copyright 2016, Tribunal de Contas da Unio
Impresso no Brasil / Printed in Brazil

FUNDADOR
Os conceitos e opinies emitidas em trabalhos doutrinrios Ministro Iber Gilson
assinados so de inteira responsabilidade de seus autores.
SUPERVISOR
Ministro Aroldo Cedraz de Oliveira
Permite-se a reproduo desta publicao, em parte ou no
todo, sem alterao do contedo, desde que citada a fonte e CONSELHO EDITORIAL
sem fins comerciais. Ministro-substituto Augusto
Sherman Cavalcanti
www.tcu.gov.br Procurador-Geral Paulo Soares Bugarin
Eduardo Monteiro de Rezende
Rainrio Rodrigues Leite
Misso Flvia Lacerda Franco Melo Oliveira

Aprimorar a Administrao Pblica em benefcio da


RESPONSABILIDADE EDITORIAL
sociedade por meio do controle externo Instituto Serzedello Corra
Centro de Documentao
Viso
Ser referncia na promoo de uma Administrao Pblica COLABORADORES
efetiva, tica, gil e responsvel Biblioteca Ministro Ruben Rosa

TRADUO
Secretaria de Relaes Internacionais

Projeto Grfico
Pablo Frioli

Imagens
iStock

Diagramao, capa e fotomontagens


Vanessa Vieira - ISC/ Seducont

Centro de Documentao
SAFS Quadra 4 Lote 1
Edifcio Anexo III - Sala 21
Braslia-DF
Revista do Tribunal de Contas da Unio. - v.1, n.1 (1970) - . Braslia : TCU, 70.042-900
1970- . revista@tcu.gov.br
v.
De 1970 a 1972, periodicidade anual; de 1973 a 1975, quadrimestral; de 1976 Impresso pela Sesap/Segedam
a 1988, semestral; 1989, quadrimestral; 1990 a 2005, trimestral; 2006, anual; a
partir de 2007, quadrimestral.

ISSN 0103-1090

1. Controle de gastos pblicos Brasil. 2. Controle externo Brasil. I. Tribunal


de Contas da Unio.

Ficha catalogrfica elaborada pela Biblioteca Ministro Ruben Rosa


Carta ao Leitor

P rezado leitor,

Carta ao
A Administrao Pblica atravessa um perodo marcado por desafios importantes,
provocados pela evoluo tecnolgica da Era Digital e pelo envolvimento crescente da sociedade
na formulao de polticas pblicas e em discusses sobre eficcia e transparncia na aplicao de

Leitor recursos do Estado. Testemunhamos uma transformao nas relaes entre governo e cidados,
qual o controle externo no pode e no vai ficar indiferente.
Os que acompanham a Revista do TCU sabem que o tema no indito nesta publicao.
Ainda assim, certo que estamos longe de esgotar o assunto, haja vista a amplitude de
possibilidades e perspectivas que essa nova era nos traz. A presente edio, em particular,
dedica-se a um olhar para o futuro prximo para os avanos que podero ser conquistados
a partir das mais modernas tcnicas de minerao de dados, anlise semntica de textos,
geoprocessamento e realidade virtual.
Investimentos em cincia e tecnologia so essenciais ao desenvolvimento sustentvel e
construo de economias produtivas, com sociedades mais justas e inclusivas. Segundo a Organizao
para Cooperao e Desenvolvimento Econmico (OCDE), uma das lies mais importantes das
ltimas duas dcadas foi o papel fundamental da inovao no desenvolvimento econmico.
Assim, ao intensificar o uso da Tecnologia da Informao no controle externo e compartilhar suas
experincias, o Tribunal de Contas da Unio (TCU) aponta caminhos a serem seguidos pelo Estado,
de modo a tornar-se mais eficiente, transparente e eficaz no atendimento aos anseios da populao.
No h dvidas de que a atividade de auditoria, na Era Digital, passa necessariamente pelo uso
intensivo do assim chamado Big Data Analytics. O processamento de volumes colossais de dados,
para deles extrair conhecimentos teis gesto pblica e sua fiscalizao, torna-se cada vez mais
presente graas evoluo da aprendizagem de mquina e da inteligncia artificial. Como nos
lembra o entrevistado desta edio, Cezar Taurion, os avanos nessa rea so to rpidos que temos
dificuldade at mesmo em imaginar os resultados que podero ser alcanados nos prximos anos.
Ao assumir posio de vanguarda no uso desses instrumentos, o TCU j tem colhido frutos
de modelos preditivos e algoritmos inteligentes produzidos por nossas prprias equipes tcnicas.
Como relata na coluna Opinio o Secretrio Wesley Vaz, responsvel por tais iniciativas,
trata-se de incorporar novas ferramentas rotina de trabalho dos auditores, de modo a escolher
melhor as aes de controle a serem realizadas pelo Tribunal e, ato contnuo, execut-las de
forma eficiente, tempestiva e precisa, conferindo assim maior efetividade atuao desta Corte.
De maneira similar, esto em desenvolvimento novos mtodos de trabalho com base
Bruno Spada

na captao, no tratamento e na anlise de imagens seja por tcnicas tradicionais de


geoprocessamento ou com as inovaes da realidade virtual que prometem revolucionar,
dentro de pouco tempo, a realizao de auditorias ambientais, em obras pblicas e em outros
empreendimentos que envolvam grandes extenses territoriais.
Por fim, conforme ilustram diversos artigos publicados nesta edio, importante ressaltar
que a transformao digital da atividade de controle no assunto de interesse exclusivo dos
Tribunais de Contas e rgos similares. Universidades brasileiras, como a Universidade de
Braslia (UnB) e a Universidade Federal de Minas Gerais (UFMG), e centros de excelncia
internacionais em contabilidade e auditoria, como a Universidade Rutgers, nos Estados
Unidos, possuem equipes de pesquisadores dedicados ao desenvolvimento de solues que
potencializem o uso da tecnologia e de grandes massas de dados como instrumentos para se
combater, com maior eficcia, os desvios e as fraudes na aplicao dos recursos pblicos.
Estamos, portanto, diante do desafio de inovar continuamente, com foco em resultados
orientados pela estratgia do Tribunal, de modo a consolidar o protagonismo desta Casa
Aroldo Cedraz de Oliveira
perante o sistema de controle nacional e internacional. Mais ainda, trata-se de imperativo para
ministro do Tribunal de Contas
que sejamos capazes de desempenhar a contento a misso que nos foi incumbida h 126 anos:
da Unio e supervisor do Conselho
aprimorar a administrao pblica em benefcio da sociedade.
Editorial da Revista do TCU.
Boa Leitura!

4 Revista do TCU 137


Sumrio

Entrevista
07 Opinio 13 Destaque 17

Entrevista Opinio Destaque


Cezar Taurion Wesley Vaz Silva 17 Nova Pesquisa em
Jurisprudncia
Scio e lder de Digital Secretaria de Gesto
de Informaes para o
Transformation da Kick
Controle Externo
Ventures e VP de Inovao
13 Os pilares da estratgia
do Instituto Smart City de anlise de dados
Business e consumo de
informaes no TCU
07 As inovaes
tecnolgicas na
fiscalizao

Setembro/Dezembro 2016 5
Sumrio

Jos Irley Ferreira Jnior


Artigos 18 Rodrigo Affonso de
Albuquerque Nbrega
Leise Kelli de Oliveira

81 O potencial de dados
de sensoriamento
remoto na fiscalizao
de obras pblicas

Osmar Ablio de
Carvalho Jnior
Renato Fontes Guimares
Roberto Arnaldo
Trancoso Gomes

97 Implementao de
um geocatlogo para
auxlio na localizao e
recuperao de dados
geogrficos abertos
Artigos Rherman Radicchi
Teixeira Vieira
18 Fundamentos de Andr Delgado de Souza Drausio Gomes
uma auditoria em Leonardo Pereira Garcia dos Santos
realidade misturada Erick Muzart Fonseca Alexandre Zaghetto
dos Santos 107 O porqu de
Aroldo Cedraz
Francisco Osrio Ramos 53 InfoSAS: um sistema governana de dados
de minerao de em organizaes
24 Plataforma de servios dados para controle de controle
de dados abertos do da produo do SUS
TCU: crowdsourcing, Ricardo Dantas Stumpf
nuvem cvica e Osvaldo Carvalho
aplicativos cvicos 117 O georreferenciamento
Marcos Prates dos bens imveis
Raquel Minardi pblicos no
Monique Louise Monteiro Wagner Meira Jr.
Remis Balaniuk sistema geodsico
Renato M. Assuno brasileiro para fins
Marcelo Pacote Jos Nagib Cotrim rabe de incorporao no
32 A recuperao 61 Aplicativos de cadastro tcnico
semntica da auditoria: uma multifinalitrio:
informao no contexto ferramenta eficaz para construo da
do controle externo assegurao de compras regularizao imobiliria
governamentais dos municpios
Mrcia Martins de
Arajo Altounian Qiao Li Davi Lopes Silva
Beatriz Pinheiro Jun Dai
de Melo Gomes 125 Uso de tcnicas de
71 Modelagem de dados inteligncia artificial
43 Geotecnologias e geogrficos para para subsidiar aes
o monitoramento definio de corredores de controle
dos Objetivos de alternativos no rodoanel
Desenvolvimento da regio metropolitana Lus Andr Dutra e Silva
Sustentvel pelas de Belo Horizonte:
Entidades de cenrios comparativos
Fiscalizao Superior

6 Revista do TCU 137


Entrevista // Cezar Taurion As inovaes tecnolgicas na fiscalizao // Entrevista

As inovaes
tecnolgicas na
fiscalizao
Vincius Magalhes

Cabe ao Tribunal de Contas da Unio


verificar se as instituies governa-
mentais esto utilizando recursos
pblicos de forma efetiva e eficien-
te. Como as inovaes tecnolgicas
podem ajudar o TCU a cumprir essa
misso e fazer mais com menos?
A evoluo tecnolgica
avana em ritmo exponencial,
surpreendendo aos mais desavisados.
A capacidade computacional de um
supercomputador de 10 milhes
de dlares em 1985 est embutida
hoje em um smartphone. A Internet
est se massificando. Um rpido
Cezar Taurion olhar ao passado recente mostra
Scio e lder de Digital Transformation da Kick Ventures e VP de Inovao quo impressionante o ritmo das
do Instituto Smart City Business mudanas. Em 1995, h apenas
21 anos, ramos 35 milhes de
Alm de profissional da Tecnologia da Informao, Cezar Taurion um vido estudio- navegantes na Internet mundial.
so dessa rea desde o final da dcada de 70, tendo produzido nove livros sobre os mais Hoje somos quase trs bilhes, cerca
variados ramos da TI, como software livre, grid computing, software embarcado, inova- de 40% da populao mundial. 80
o, cloud computing, big data e transformao digital. Na sua formao acadmica en- milhes usavam celulares, hoje trs
tram conhecimentos em Economia, Cincia da Computao e Marketing de Servios. em cada quatro pessoas do mundo
Ele foi professor do MBA em Gesto Estratgica de TI na FGV/RJ e de Empreendedorismo tm um, ou mais de 5,2 bilhes de
na Internet pelo NCE/UFRJ. Nos ltimos anos, tem participado ativamente do desenvol- pessoas. No devemos pensar na
vimento e aplicao de novas tecnologias, tanto no Brasil como no exterior, o que lhe revoluo digital como uma simples
permite acompanhar casos reais das mais diversas caractersticas e complexidades. automatizao de processos atuais.
No desempenho dessa atividade, Taurion busca compreender e avaliar os impactos Estamos em um novo jogo. O trabalho,
das inovaes tecnolgicas nas organizaes e em seus processos de negcio. Para ele, os modelos de negcios, as estruturas
o pensar fora da caixa insuficiente porque a caixa ainda nos prende a uma fonte de organizacionais, produtos e servios
referncia, limitando o pensamento inovador. Nesta entrevista Revista do TCU, o espe- sero efetivamente transformados
cialista em TI aborda temas como transformao digital, tecnologias exponenciais, Inteli- atravs das tecnologias digitais.
gncia Artificial (IA) e o impacto de tudo isso na sociedade, nos negcios e nas atividades Hoje, as tecnologias permitem de
do Tribunal de Contas da Unio. forma muito mais fcil e barata que

Setembro/Dezembro 2016 7
Entrevista // Nonononono

h dez anos, cruzar dados obtidos nencial, nos leva terrvel armadilha
de diversas fontes, que variam de de subestimar o impacto das trans-
bases de dados convencionais a redes
sociais, onde todos ns deixamos
Todos os rgos formaes. Um exemplo de como a
mudana exponencial subestimada
nossas pegadas digitais. Os cidados de governo podem e foi o Human Genome Project. Foi lan-
esto mais empoderados e com seus ado em 1990, com estimativa de ser
smartphones esto conectados a concludo em 15 anos a um custo de
milhares de outros atravs de redes
devem estar conectados, US$ 6 bilhes. Em 1997, metade do
sociais, compartilhando seus pontos prazo, apenas 1% do genoma huma-
de vista, opinies e comentrios. enviando informaes no tinha sido sequenciado. Pelo pla-
Assim, alm de tecnologias mais nejamento linear que ns adotamos,
baratas e disponveis, as aes de continuamente. Por que supondo 1% em 7 anos, levaramos
fiscalizao podem contar com a 700 anos para concluir o sequencia-
colaborao da prpria sociedade. esperar semanas e meses mento. Parece lgico, no? A presso
para encerrar o projeto foi imensa,
Quais as tecnologias que o senhor mas quando perguntaram ao futurista
classificaria como mais importantes
para analisar dados, se esses Ray Kurzweil, ele disse 1% significa
para o Controle Externo? Por qu? metade do caminho. Vo em frente!.
Algumas tecnologias como a puderem ser analisados Ele pensou exponencialmente. 1%
Internet e os smartphones permitem dobrando a cada ano significa che-
acesso rpido e fcil a qualquer mo-
mento. Todos os rgos de governo
de forma contnua? gar aos 100% em 7 anos. O projeto
foi concludo em 2001, quatro anos
podem e devem estar conectados, en- antes do planejado e custando muito
viando informaes continuamente. o) por 25%, quando considerando menos dinheiro que o estimado. O
Por que esperar semanas e meses para o sucesso da contratao, ou seja, o pensamento linear, tradicional, errou
analisar dados, se esses puderem ser acerto da contratao do novo fun- o alvo por 696 anos! Muitas vezes o
analisados de forma contnua? As cionrio na empresa. Com o uso de pensar fora da caixa insuficiente,
aes tero efeito muito mais imedia- algoritmos preditivos, podemos no pois a caixa ainda nos prende a uma
to. As anlises podem ser muito mais apenas nos contentar com descrio fonte de referncia, limitando o pen-
eficazes se usarmos algoritmos e in- e anlise de fatos passados, mas fazer samento inovador...
teligncia artificial. Alis, algoritmos predies de comportamento de r-
j esto em toda parte, de recomen- gos pblicos baseadas nos padres O envolvimento do cidado nas anli-
dao de livros e filmes deteco observados at o momento. ses e decises tomadas pelo governo
de fraudes por operadoras de cartes parece ser uma abordagem que veio
de crdito. Estamos imersos em um Na sua opinio, qual o maior obst- para ficar. Hoje em dia essa partici-
oceano de dados, e pouco uso faze- culo quando se quer introduzir ino- pao , inclusive, considerada ele-
mos deles. Estimativas apontam que vaes tecnolgicas no ambiente de mento essencial em uma democracia.
em 2020 estaremos criando em todo trabalho? As barreiras culturais ou as Quais as ferramentas tecnolgicas
o planeta 73,5 zettabytes de dados ou limitaes financeiras? Por qu? que voc considera mais eficazes na
73 seguido de 21 zeros! Os resultados Existem, claro, as limitaes finan- promoo do dilogo entre as insti-
da aplicao de algoritmos mostram ceiras, mas o custo da tecnologia vem tuies pblicas e a sociedade?
que se conseguem bons resultados caindo e continuar caindo de forma As redes sociais j fazem parte do
em praticamente qualquer situao. expressiva. Hoje, por cerca de cem dia a dia de grande parte da sociedade
Por exemplo, um estudo efetuado nos reais, compram-se dispositivos de ar- e esse nmero tende a aumentar. Se
EUA, pela American Psychological mazenamento de um terabyte (um observarmos de perto esse fenme-
Association, analisando 17 casos de trilho de bytes) que custavam cen- no constatamos que a Internet e as
estudo de prticas de contratao por tenas de milhares de reais h pouco redes sociais podem ser vistas como
grandes empresas, mostrou que o uso mais de dez anos. A grande barreira tecnologias cognitivas descentraliza-
de algoritmos vencia as melhores pr- a cultural. O nosso pensar de forma doras, onde mais e mais pessoas po-
ticas (geralmente baseadas na intui- linear, quando a evoluo expo- dem emitir suas ideias e opinies de

8 Revista do TCU 137


Entrevista // Cezar Taurion Entrevista

forma muito rpida, fora do controle analisar os dados. Outra caracterstica


dos mecanismos centralizadores. interessante que afeta nossa manei-
Comparemos um evento transmiti- Com o uso de algoritmos ra de olhar os dados que volumes
do ao vivo por uma TV unidirecional grandes no demandam preciso
preditivos, podemos no
com uma rede social. Na TV somos extra de cada dado. Alis, j fazemos
obrigados a ver as imagens e ouvir a apenas nos contentar com isso hoje. Pensemos em um nmero
voz que a emissora libera, enquanto grande como o PIB de um pas. No
nas redes, cada um que esteja pre- descrio e anlise de detalhamos os centavos, mas ficamos
sente ao evento filma de um deter- fatos passados, mas fazer restritos aos grandes nmeros e s
minado ngulo e emite suas prprias tendncias que eles apontam.
percepes do fato, compartilhando predies de comportamento
em tempo real com milhares de ou- O que necessrio para se obter da-
de rgos pblicos baseadas dos concretos, quando se est diante
tros. Cria uma topologia de poder
menos vertical e muito mais aberta. nos padres observados de uma abundncia de informao?


No existe mais o controle centraliza- Temos que seguir alguns passos.
do dos canais de distribuio de ideias at o momento. Primeiro essencial ter um patroci-
e as trocas horizontais substituem o nador de alto nvel na organizao.
modelo vertical e centralizado. No pode ser uma ao limitada a
presenta a opinio das pessoas que determinada rea ou restrita ao setor
Nos ltimos anos, a atividade de fis- trabalham fora. Podem ter um ponto de TI. Depois, definir claramente os
calizao migrou de falta de informa- de vista bem diferente das que podem objetivos de negcio, que problemas
o para abundncia de dados. Qual atender o telefone domstico durante as iniciativas de anlise massiva de
o caminho mais vivel para uma o dia. Alm disso, se quisermos deta- dados iro resolver? Um fator funda-
instituio - cuja atividade principal lhar um pouco mais a pesquisa, um mental: a equipe. Dificilmente con-
depende da anlise de informao universo de amostras pequeno, como seguiremos pessoas que atendam
identificar os melhores dados e de- fazemos hoje, no ter representativi- equao hackers + profundos conhe-
cidir como us-los/interpret-los? dade estatstica. cimento estatsticos e matemticos
A imensa disponibilidade de da- + bons conhecimento de negcio.
dos embute mudanas na maneira de Qual seria um bom exemplo disso? Uma sugesto montar uma equipe
pensarmos dados. Quando samos do As pesquisas de inteno de voto. multidisciplinar e operacionalizar os
pensamento baseado na escassez para Geralmente pegam-se umas duas mil processos que envolvam os proje-
abundncia de dados, devemos pensar pessoas e tem-se um quadro geral. tos de anlise de dados. Claro que
diferente. Pela dificuldade e limitao Mas se quisermos detalhar ao ponto a equipe deve ter um bom gestor,
tecnolgica que existia, ns acabamos de querermos saber a inteno de que consiga entender as diversas
construindo um modelo mental de es- jovens entre 18 e 25 anos do estado linguagens faladas por profissionais
cassez de dados. Com isso refinamos da Paraba, a amostragem ser insu- to diferentes entre si e que seja
uma srie de prticas como anlises ficiente. Estamos presos s perguntas apaixonado pelo conceito de anali-
estatsticas por amostragem. A partir iniciais e no podemos sair delas. Mas sar dados. Um gerente burocrata no
de uma pequena amostra de dados, com volumes grandes o pensamento vai conseguir desfiar os inevitveis
extrapolamos para um cenrio mais outro. Quando a varivel passa a problemas de comunicao inter e
amplo. Com o tempo refinamos os ser N=todos podemos fazer gra- intra equipe. E montar uma equipe
modelos e hoje eles so bastante confi- nulaes inimaginveis no modelo apenas com hackers, por exemplo,
veis. Entretanto, h algumas lacunas. de escassez. Podemos identificar pode gerar um algoritmo preditivo
A preciso depende muito da amos- tendncias e descobrir correlaes sensacional, mas de pouco valor para
tragem. Por exemplo, uma pesquisa no pensadas antes. Podemos fazer a organizao. Afinal, o objetivo no
de opinio baseada em uma amostra novas perguntas e descer a novos gerar modelos analticos fantsti-
randmica de usurios de telefones nveis de segmentao. Samos para cos, mas sim resolver problemas de
fixos embute um vis: se a coleta for um mind set mais oportuno ou seja, negcio, como eficcia e eficincia
feita no horrio de trabalho, quem aproveitamos oportunidades de fa- da fiscalizao. E, finalmente, gover-
vai atender no necessariamente re- zer perguntas no pensadas antes de nana. Pelas caractersticas de lidar

Setembro/Dezembro 2016 9
Entrevista // Nonononono // Entrevista

com volumes muito grandes e va- Agora o risco de desemprego afeta


riados, com dados no estruturados funes que antes eram reservadas
(anttese do modelo estruturado e re-
lacional que estamos acostumados),
Muitas vezes o pensar aos humanos. Por exemplo, motoris-
ta de caminho. um dos trabalhos
tende-se a no documentar e nem
fora da caixa insuficiente, mais comuns no mundo todo. So
criar processos de governana. Com pois a caixa ainda nos 3,5 milhes deles nos Estados Unidos
isso existe o risco de reinventar-se a e, aqui no Brasil, temos mais de um
roda constantemente. prende a uma fonte de milho registrados para o transpor-
te de carga. O governo holands j
referncia, limitando o
As ferramentas de TI so muito efi- realizou um teste bem-sucedido de
cientes na coleta e classificao de
dados, mas o senhor acredita que
pensamento inovador... caminhes sem motorista cruzando a
Europa. O Uber recentemente pagou
elas podem ser confiveis quando se US $ 680 milhes para comprar Otto,
trata de interpretao? computador se intrometia na vida dos uma startup que desenvolve tecnolo-
Depende claro da eficincia do astronautas da tripulao : Just what gia para caminhes autnomos e que
algoritmo. Entretanto, a evoluo do you think youre doing, Dave?. foi fundada por especialistas de IA
muito rpida. Em 2009, quando o De l para c vimos filmes de robs do Google. A consultoria McKinsey
Google falava em carros autnomos, como Terminator, Eu, rob, Ela previu que, dentro de oito anos, um
era curiosidade futurista. Hoje j e Jarvis, o assistente pessoal de Tony tero de todos os caminhes na es-
praticamente uma realidade. Hoje os Spark em Iron Man. A propsito, trada ser autnomo, rodando sem
sistemas de reconhecimento e ima- Jarvis significa Just Another Rather motoristas. Em talvez 15 anos, o
gens do Facebook so mais eficientes Very Intelligent System. Fico cien- motorista de caminho, como o as-
que o ser humano em reconhecer ros- tfica poderia muito bem ser definida censorista, ser um anacronismo. O
tos em fotografias. Portanto, temos como antecipao cinetfica. Muito Uber investiu em Otto no apenas
que pensar de forma exponencial. que vemos em Jarvis, de alguma for- para operar caminhes, mas porque
Isso significa que se uma tecnologia ma, j est no nosso dia a dia. quer operar frotas de carros autno-
digital, hoje, ainda no est to eficaz, Jeff Hawkins, fundador da mos. Em setembro, comeou a testar
talvez em dois a trs anos esteja dez Numenta (e inventor do Palm Pilot), essa frota em Pittsburgh. O servio
ou vinte vezes melhor. diz que a IA est hoje em um ponto postal do Canad quer enviar avies
similar ao da computao no incio da no tripulados, em vez de vans, para
I n t e l i g n c i a A r t i f i c i a l (I A) e dcada de 1950, quando os pioneiros entregar correio rural.
Aprendizagem Automtica Avanada estabeleceram as ideias bsicas dos No TCU, me parece claro que
(Advanced Machine Learning) es- computadores. Menos de 20 anos o papel da IA ser o de um auxiliar
to entre as chamadas Tendncias depois, os computadores tornaram extremamente eficaz na anlise de
Estratgicas de Tecnologia, uma vez possveis sistemas de reservas de contas, analisando de forma ampla
que permitem a criao de sistemas companhias areas e ATMs (caixas e rpida milhes de documentos,
capazes de compreender, aprender e eletrnicos) bancrios e ajudaram a fazendo comparaes e identifi-
prever eventos que podem melhorar NASA a colocar o homem na lua, cando correlaes que nem sempre
a tomada de deciso. Na sua opinio, resultados que ningum poderia ter ns humanos conseguimos fazer.
quais so os desafios e benefcios da previsto nos anos 50. Adivinhar o No temos capacidade de lidar com
utilizao dessas tecnologias por impacto da IA e dos robs em uma grandes volumes de dados muito ra-
uma Corte de Contas? dcada ou duas est se tornando ain- pidamente. Assim, nossas decises
A revoluo conduzida pela IA da mais difcil. Daqui a vinte anos, muitas vezes so influenciadas por
est chegando to rpido que temos essa tecnologia ser um dos principais experincia pessoais.
dificuldade em imaginar como ela motores da inovao e da tecnolo-
se tornar. O imaginrio de fico gia, se no a principal, diz Hawkins. As instituies governamentais
cientfica ainda predomina. Lembro Indiscutvel que a IA vai afetar a socie- esto cada vez mais dependentes de
de uma frase, de um dos filmes que dade e o emprego como conhecemos. sistemas, tecnologia e dados. Nesse
me marcaram e que tenho em casa, A automao, em seu incio, afetou cenrio, segurana da informao e
2001: A Space Odyssey, onde o as linhas de produo nas fbricas. segurana ciberntica desempenham

10 Revista do TCU 137


Entrevista // Cezar Taurion Entrevista

um papel extremamente importante. conseguiremos responder mais


Na sua opinio, quais so os precisamente a perguntas como
principais desafios e entraves para
tornar sistemas e informaes mais
No TCU, o papel da nos relacionamos, como novas
ideias se infiltram e se disseminam
seguros? IA ser o de um auxiliar pela sociedade, como a timeline do
Esse um dos grandes desafios. Facebook expressar a vida de uma
Temos dois pontos a validar. Um
extremamente eficaz pessoa (hoje ele recebe em mdia
a garantia de segurana dos dados. na anlise de contas, 0,6 Mb de novos dados por usurio,
Outro garantir privacidade. E esse por dia), como os tuites mostraro a
um assunto que bem fludo. analisando de forma reao da sociedade a determinados
Deixamos uma imensa pegada eventos e como o retngulo do
digital no nosso dia a dia. As redes ampla e rpida milhes Google explicitar os cantos das
sociais, como o Twitter e Facebook, nossas mentes.
so gigantescos repositrios de documentos, fazendo
de opinies e comentrios. Por A inovao , hoje em dia, um fator
comparaes e identificando
exemplo, haver mais palavras crtico de sucesso para as organiza-
escritas no Twitter nos prximos correlaes que nem es, incluindo o governo. A adoo
dois anos do que as contidas em de novas metodologias e tecnolo-
todos os livros j impressos. O sempre ns humanos gias frequentemente um requisi-
Facebook, com seus mais de 1,4 to essencial para a inovao. Nesse
bilho de usurios (936 milhes
entram todo dia nele), hoje a maior
conseguimos fazer. sentido, quais mtodos e tcnicas,
na sua avaliao, teriam potencial
rede da histria da humanidade. para promover prticas de controle
Olhando esta imensa quantidade autocensura. Nas buscas, consegue- inovadoras?
de usurios e considerando que se obter informaes praticamente O impacto da transformao di-
aproximadamente um quarto do impossveis de se obter por gital dever ser muito maior que o
mundo tem menos de 14 anos de pesquisas tradicionais. O Google do conceito de e-commerce de uns
idade, isso significa que mais ou Trends pode gerar excelentes 15 anos atrs. Hoje a maior parte das
menos 25% dos adultos do planeta amostras da mente privada, do que transaes que setores inteiros de in-
tm conta no Facebook. Outra fonte as pessoas realmente querem saber e dstria fazem com seus clientes j
inesgotvel de informaes sobre que nem sempre compartilham com via Internet, como bancos, comrcio
quem somos a famosa pgina outras. Buscam sozinhas. Apenas e empresas areas. Comprar online
inicial do Google, contendo apenas o Google sabe...Vrios projetos rotina. Novos modelos de negcio
um campo para entrada de dados. j mostram o quanto possivel surgem, como o AirBnB, e colocam
um repositrio do id coletivo saber com o Google Trends, como em cheque setores consolidados,
da humanidade. Ele ouve nossas previso do mercado de aes, o que como o hoteleiro. Em muitos pases,
confisses, preocupaes e segredos. move a produtividade econmica, novos modelos de emprstimos,
Ns digitamos naquele retngulo epidemias de gripe e dengue, como os fornecidos pelo LendingTree
o que queremos, sem censura. incidncia de racismo e preconceitos (EUA) e Kiva, esto mudando a rela-
Como so buscas que as pessoas arraigados. Como estamos falando o entre a sociedade e os fornecedo-
fazem sem censura, expressam de algo muito recente, existe res tradicionais de emprstimos, as
nelas sentimentos de dio e ainda uma longa caminhada de instituies financeiras. Na Alemanha
preconceitos, que geralmente so aprendizado. A Internet muito o Friendsurance uma ruptura no
camuflados pelo comportamento jovem como registro humano modelo tradicional da indstria de
social em pblico. Este o problema predominante e o prprio Facebook seguros.
do cientista social: o que eles mais s ganhou esta proporo toda nos Est ntido que a sociedade j est
querem saber justamente o ltimos seis anos. As informaes acostumada a usar a Web e os apps
que seus objetos de estudo mais sobre o comportamento humano dos smartphones para suas ativida-
tentam esconder. O simples ato ainda esto sendo construdas e des do dia a dia, seja a de localizar um
de perguntar algo incmodo gera talvez daqui a dez ou vinte anos txi, comprar um produto, fazer um

Setembro/Dezembro 2016 11
Entrevista // Nonononono

check-in do voo ou uma transfern- escritrios presidem organizaes em


cia eletrnica entre contas correntes. forma de pirmide, recebendo altas
Cosmticos um exemplo interes-
sante. H cinco anos, os brasileiros
A transformao de uma comisses, enquanto batalhes de
advogados principiantes fazem o
no compravam pela Web. Em 2014, organizao depende de trabalho rduo de buscar precedentes
gastaram 1,3 bilho de reais. Ainda mudana da mentalidade e elaborar contratos. Os altos custos
apenas 1,5% das vendas deste merca- destes escritrios e dos seus hono-
do, contra 6% nos EUA. Imaginem o
potencial de crescimento. E, novamen-
na alta administrao. rrios propiciam um cenrio aberto
a disrupes. J existem algumas
te, quem comeou foi um negcio fora iniciativas muito interessantes que,
das tradicionais empresas do setor, a ao banco digital porque foram pro- ainda desdenhadas pelos advogados
BelezanaWeb. O uso de aplicativos vocados pelas Fintechs. A velocidade tradicionais, podem provocar um
como WhatsApp mudou a maneira das mudanas no foi opo deles, efeito Uber nos prximos anos.
como as pessoas interagem. Famlias mas necessidade de reao. Para vi- Alguns escritrios de advocacia
trocam mais mensagens entre si que sualizar e construir o futuro, temos nos EUA j usam IA como associa-
falam por fone. E praticamente todos que ser, ao mesmo tempo, otimistas do digital, delegando a algoritmos
ns compartilhamos, at compulsiva- e realistas. No fcil, mas precisa- preditivos a tarefa de executar bus-
mente, nossas ideias, opinies e qua- mos constru-lo, para no sermos cas inteligentes por documentos, pa-
se tudo que fazemos em plataformas descontrudos por ele. receres e jurisprudncias referentes
de mdias sociais como Facebook e aos casos em anlise. Interessante
Instagram. A sociedade est cada vez A gesto do conhecimento que uma anlise feita na Europa e
mais tecnolgica e o processo de con- (Knowledge Management, KM) EUA, sobre o uso de IA na advoca-
sumerizao de TI um movimento ainda um grande desafio para or- cia, mostra que, salvo raras excees,
que pressiona as empresas a adotar as ganizaes como o TCU, que tm no so as tradicionais bancas de ad-
mesmas tecnologias que seus clientes na informao e no conhecimento vogados, mas novos entrantes, que
j usam. Eles adotam primeiro! a principal matria prima para de- investem no conceito. Vemos que o
As organizaes tm que se ajus- sempenhar suas atividades. Qual momento do Uber, Airbnb, Skype
tar velocidade da transformao abordagem o senhor acredita que e Whatsapp se repete. As empresas
digital. A transformao de uma or- ter maior impacto nas estratgias estabelecidas tendem a ser conser-
ganizao depende de mudana da de KM dos prximos anos e por qu? vadoras e lutam para preservar seu
mentalidade na alta administrao. A gesto do conhecimento tem modelo de negcios. Enfim, estamos
Os gestores precisam entender a muito a ver com o uso de algortimos diante de mudanas significativas na
urgncia da mudana para poderem e IA. Vamos pegar, para comparao, sociedade e praticamente nenhuma
provoc-la. Com este apoio, uma uma tradicional profisso, a advoca- funo ou setor de negcios estar a
nova mentalidade incentivadora de cia. Uma provocao que podemos salvo das transformaes. O cenrio
mudanas provoca a contratao de fazer : ainda existiro advogados conturbado, como o contexto que
talentos que hoje inexistem. A trans- no futuro?. A taxa de acertos em pre- vemos hoje envolvendo o Uber e os
formao digital exige que a organi- vises futuristas a mesma de chim- taxistas, certamente vai acontecer
zao saia da sua zona de conforto. panzs jogando dardos e acertando o quando os escritrios de advocacia
A velocidade das mudanas no per- alvo, mas podemos debater algumas sentirem reais ameaas ao seu mode-
mite mais planejamentos de longo ideias e tirarmos concluses por ns lo atual. Mas, alguns entendero que
prazo baseados apenas em evolu- mesmos. Claro, desde que no nos o processo irreversvel e os ven-
es incrementais, como ampliao apeguemos a crenas e paradigmas cedores sero os que conseguirem
de um mercado ou lanamento de que nos limitam o olhar crtico. fazer o mix certo entre advogados
novos produtos similares. O ines- Vamos analisar o contexto. As pr- e tecnologia. O mesmo poderamos
perado surge a cada instante. O ce- ticas de trabalho dos advogados no dizer sobre o TCU. O conhecimen-
nrio de negcios passa a ser cada mudaram muito nas ltimas dca- to agregado torna-se realmente til
vez mais voltil, ambguo, incerto e das. De maneira geral, os advogados quando manipulado de forma gil
complexo. Os grandes bancos s se oferecem assessoria personalizada de por motores de IA, apoiando o tra-
moveram com rapidez em direo alto custo e os scios dos prestigiados balho dos ministros.

12 Revista do TCU 137


Opinio Os pilares da estratgia de
anlise de dados e consumo
de informaes no TCU
Eficincia e efetividade: palavras que resumem necessidades fundamentais impostas a
todas as organizaes, pblicas ou privadas ou seja, entregar resultados relevantes com a
menor utilizao de recursos. Fazer o melhor possvel aquilo que deve ser feito torna eficincia e
efetividade conceitos fortemente conectados. O desalinhamento entre os dois pode representar
excelncia ao inverso: estar fazendo muito bem algo que no deveria estar sendo feito. O TCU,
com a misso de aprimorar a administrao pblica em benefcio da sociedade por meio do
controle externo, tambm deve buscar fazer mais e melhor o que a ele compete.
Especificamente sobre o TCU, enquanto auxiliar do poder de fiscalizar a legalidade e
legitimidade dos gastos, bem como o bom funcionamento das polticas pblicas, pode-se
sintetizar eficincia e efetividade como a necessidade de fazer melhor e escolher melhor o
que fazer. Dada a limitao de recursos, cada vez mais importante ser certeiro na fase de
planejamento, projetando aes de controle com base no risco, materialidade e relevncia
identificados em cada um dos objetos. O fazer melhor representa o bom funcionamento
dos processos de trabalho relacionados s atividades de controle externo, em que se demanda
o pleno funcionamento dos mtodos e disponibilidade das ferramentas e de profissionais
capacitados.
Para planejar e executar da maneira desejada, um dos insumos fundamentais a informao.
o uso correto e tempestivo da informao que permite que as organizaes tomem decises
mais apropriadas sobre o que fazer e como fazer.
Em que pese o desafio da eficincia e efetividade ser perene no mundo corporativo, o
cenrio atual nos exige pensar em novas alternativas. Considerando que a quantidade de
sistemas de informao tem crescido a ponto de os principais atos e fatos administrativos
(contrataes, licitaes, pagamentos, concesses de benefcios etc.) poderem ser representados
digitalmente, informaes sobre o funcionamento do Estado e de interesse do controle externo
esto cada vez mais disponveis, prontas para serem analisadas e consumidas.
A tendncia de utilizao macia dos dados pblicos est posta e similar realidade atual
das organizaes privadas. A informao est e estar cada vez mais abundante, distribuda e
fluda, adaptvel interpretao de diversos atores. Por isso ser cada vez mais difcil (se no
impossvel) reter as informaes ou impedir que elas sejam combinadas para gerar outras.
A abundncia das informaes, somada s infinitas formas de combin-las, nos impe outro desafio:
consumi-las. Ter sua disposio a rota mais rpida para se locomover de um ponto a outro em
dias de chuva torrencial alentador, mesmo sabendo que aquilo s ocorre porque existe uma
comunidade de usurios que contribuem produzindo e consumindo informaes, de maneira
simples e barata. Efetivo e eficiente, no?
Considerando que a utilizao correta da informao abundante sobre o funcionamento
do Estado condio fundamental para a boa gesto dos recursos pblicos, como fazer que
rgos pblicos, incluindo os de controle, consigam utilizar plenamente esse insumo para
Wesley Vaz Silva viabilizar o aumento da sua eficincia e efetividade a custos possveis? Em outras palavras,
Secretrio o que preciso fazer, de maneira pragmtica, para que as instituies pblicas se adaptem
Secretaria de Gesto de Informaes realidade atual de exigncia de melhores produtos e servios e funcionem melhor, sob a tica
para o Controle Externo do uso de informao como recurso essencial? Como lidar com as dificuldades j conhecidas

Setembro/Dezembro 2016 13
Opinio Os pilares da estratgia de anlise de dados e consumo de informaes no TCU // Opinio

e avanar na direo da instrumentalizao instituies pblicas gozam de caracterizadas pela inovao em um ambiente
dos processos de trabalho com informaes uma estabilidade institucional e de de incerteza. Apresentado por Eric Ries no
necessrias e suficientes para cumprirem a recursos suficientes para executar seu livro Lean Startup, esse precisamente
sua finalidade? as polticas pblicas sob sua respon- o conceito de startup, sobre o qual os pilares
A seguir, apresenta-se trs pilares sabilidade. O ambiente corporativo de fomento ao uso pleno de informaes
inspirados no funcionamento de instituies mundial, pblico e privado, de pelo controle e para o controle esto sendo
pblicas e privadas nacionais e internacionais incerteza, submetido a mudanas sedimentados na estratgia do TCU. Vamos
que tm servido como base da estratgia do constantes e cada vez mais drsticas. aos pilares:
TCU, visando o pleno uso da informao
em prol do controle. A execuo de aes 2. A infalibilidade. preciso reco- I. Governana
coordenadas tem permitido ao TCU avanar nhecer que solues complexas
na utilizao de tcnicas de anlise de dados, esto naturalmente sujeitas falhas Apoio da alta administrao e liderana.
na produo e no consumo de informaes e insucessos. Em determinados Esses costumam ser os viabilizadores mais
teis ao planejamento e execuo das aes ambientes, em especial para as ins- importantes da governana corporativa,
de controle. Acredita-se que os fundamentos tituies pblicas que atuam em por representarem os pr-requisitos para as
aqui apresentados possam ser considerados ambiente altamente regulado, as fa- diretrizes superiores que suportam a misso.
por outros rgos de controle, bem como lhas podem gerar desconforto e, em Sem o claro apoio da alta direo, iniciativas
por qualquer instituio pblica brasileira ltima instncia, responsabilizao. transformadoras no so mais do que boas
que deseje repensar seu funcionamento a A reao a isso se impe na forma de ideias prestes a serem vencidas pelo cansao.
partir do consumo intensivo de informao. inibio ao surgimento de novas ini- Contudo, somente o direcionamento
Duas premissas foram fundamentais ciativas por medo do fracasso. Nesse no basta. preciso que as diretrizes se
para o estabelecimento dos pilares. Ambas contexto, uma nova relao com os transformem em estratgias. No caso do
colidem frontalmente alguns mitos da riscos deve ser estabelecida sem que TCU, que contou com direcionamento
Administrao Pblica e, por essa razo, se afronte, por bvio, o princpio da voltado ao estmulo da utilizao de
podem ser contraintuitivas em uma primeira legalidade ao qual todas as iniciati- informaes para a atividade de controle, a
leitura. Aos mitos: vas pblicas se vinculam. escolha foi a de incentivar a descentralizao
das atividades de anlise de dados para as
1. A estabilidade. H que se ques- Portanto, preciso encontrar solues unidades tcnicas. As secretarias de controle
tionar se, como era (ou ainda que forneam novos produtos e servios externo passaram a capacitar auditores do
) amplamente entendido, as para o bom funcionamento das instituies, seu corpo para iniciar os trabalhos de anlise

14 Revista do TCU 137


de dados, bem como a buscar acesso a a existncia de um ncleo prprio de superior. Alm disso, a exemplo do que
informaes teis ao seu trabalho, utilizar anlise de dados, composto por auditores j existe no TCU com o papel atribudo
ferramentas tecnolgicas de suporte e capacitados para utilizar tcnicas de anlise Secretaria de Gesto de Informaes para
compor um grupo de interesse e pesquisa de dados nos seus trabalhos. O trabalho o Controle Externo (Seginf), as entidades
no assunto. desses ncleos se baseia na colaborao e de fiscalizao superiores dos EUA, ndia
A soma do apoio da alta direo com a integrao com as demais unidades de apoio e China criaram estruturas organizacionais
formao de times de auditores tem gerado do TCU, visando inserir nos processos de responsveis pelo estabelecimento e
bons resultados e reforado o fomento trabalho cotidianos novos mtodos e execuo da estratgia corporativa para o
construo de uma nova cultura, em ferramentas, com uma estrutura leve e uso de informaes e de tcnicas de anlise
que a descentralizao e a coordenao voltada a resultados. de dados no mbito das suas operaes.
entre os papis estimulam o consumo de No mbito externo, novos grupos Estabelecidas as diretrizes, definida a
informaes para as atividades de controle institucionais tm surgido para intensificar estratgia, capacitados os profissionais e
externo. O sucesso dessa estratgia a colaborao e os trabalhos conjuntos definidos os objetivos, preciso conseguir
depende, entre outros fatores, da clareza relacionados anlise de dados. Destaca-se as ferramentas e os insumos.
dos papis e responsabilidades de cada a rede nacional de informaes estratgicas
um dos envolvidos, da confiana entre os para o controle externo Rede Infocontas, II. Plataforma
atores, da experimentao e testes geis de criada em 2013 e que, recentemente,
procedimentos sobre os dados e da avaliao fomentou a criao de uma unidade de Nas palavras do pesquisador Doug
rpida dos resultados, positivos ou negativos. anlise de informaes em cada um dos Laney, a informao s til quando pode
Em dois anos, vrias unidades tcnicas tribunais de contas estaduais do Brasil. Em ser plenamente utilizada. Se informao
do TCU lideraram trabalhos de fiscalizao nvel internacional, destaca-se a criao, no o insumo, a matria-prima, o seu pleno
utilizando tcnicas de anlise de dados. Sem ltimo congresso internacional das entidades uso no depende somente da sua existncia
a pretenso de ser exaustivo, cita-se: de fiscalizao superior realizado em ou disponibilizao. A tarefa de tornar
dezembro de 2016, de um grupo de trabalho verdadeiramente simples o consumo da
Acrdo 539/2015-Plenrio, deri- sobre Big Data e Analytics, composto por informao implica desenvolver novos
vado de Fiscalizao de Orientao diversos pases, entre eles o Brasil. O objetivo mtodos, ferramentas e competncias
Centralizada liderada pela Secretria estimular a colaborao e a troca de boas profissionais, mas antes preciso obter
de Controle Externo do Mato prticas, alm de discutir e fomentar o as informaes e torn-las plenamente
Grosso (Secex-MT) e sob a relato- desenho de novas estratgias e o uso de disponveis para o uso.
ria do ministro Benjamin Zymler, novos mtodos e ferramentas baseadas em Essa a essncia do Labcontas, ambiente
que tinha como objetivo validar a informao para a melhoria da efetividade virtual criado e gerenciado pelo TCU,
seleo de objetos de controle com e eficincia das entidades de fiscalizao que permite aos auditores terem acesso a
base em anlise preditiva de dados
relativos a transferncias voluntrias.

Acrdo 718/2016-Plenrio, rea-


lizado pela Secretaria de Controle
Externo da Previdncia, do Trabalho
e da Assistncia Social (SecexPrevi)
sob a relatoria do Ministro Vital do
Rgo, que objetivava estruturar fis-
calizao contnua de benefcios
previdencirios quanto sua con-
cesso, manuteno e pagamento
no mbito do Instituto Nacional do
Seguro Social.

Em 2016, algumas unidades tcnicas do


TCU (Secex-MT, SecexPrevi, Secex-CE e
Secex Educao, por exemplo) formalizaram

Setembro/Dezembro 2016 15
Opinio Os pilares da estratgia de anlise de dados e consumo de informaes no TCU // Opinio

informaes internalizadas a partir de dezenas um custo marginal, prximo de zero. Ou disposio do TCU. No tardar o tempo
de bases de dados oriundas de acordos de seja, o principal objetivo permitir que as em que at mesmo anlises preliminares
cooperao entre instituies da Administrao informaes sejam muito fceis de usar e automticas das evidncias possam por
Pblica Federal e o prprio TCU. tenham baixo custo. que no? ser entregues ao auditor, de forma
No intuito de se consolidar como uma O ponto que, por mais que tenhamos a subsidi-lo no seu trabalho de avaliao.
plataforma colaborativa de fato, o Labcontas equipes qualificadas e dados a nossa O reconhecimento da importncia
tambm utilizado por parceiros externos, disposio, se o intuito fomentar o da utilizao plena das informaes nas
principalmente tribunais de contas estaduais ecossistema interno e externo de consumo instituies pblicas de controle um fato,
(TCEs). Atualmente, j existem 25 desses de informaes, preciso construir solues mas que carrega consigo muitas dvidas. A
parceiros, sendo 20 TCEs, que utilizam que resolvam o problema (seja planejar maturidade heterognea das organizaes e
os softwares e as informaes pblicas da uma fiscalizao ou ter insumos para o passivo de problemas que afeta o seu pleno
plataforma e, em contrapartida, contribuem responsabilizar ou no determinado gestor) funcionamento tornam qualquer estratgia
trazendo informaes pblicas sobre o de maneira muito simples, na viso daquele de mudana na forma de trabalhar muito
funcionamento de instituies de sua que usar esse insumo para tomar decises. desafiadora. Contudo, as exigncias atuais
jurisdio e de interesse mtuo dos parceiros Mesmo que as solues utilizem algoritmos no nos parecem fornecer alternativas a no
de controle (contrataes de determinado complexos baseados em aprendizado de ser adentrar na realidade que se impe da
estado da federao, por exemplo). mquina e processamento cognitivo ou quarta revoluo industrial, do pensar digital,
A existncia de um ponto central que tcnicas mais recentes de indexao e clculo em que o consumo de bens e servios
congrega informaes e softwares para de relevncia do contedo, o que deve caracterizado pela exigncia do baixo custo
todos os seus profissionais colaboradores importar para o auditor so os resultados que e da qualidade. E esses desejos da sociedade
primordial para que os trabalhos de anlise se obtm desses produtos e o quo confiveis afloram e, cada vez mais, so direcionados
de dados e consumo de informao sejam eles so para cada propsito. para o funcionamento do Estado.
mais eficientes. O recente estmulo abertura No mbito do TCU, cabe citar o DGI A necessidade de se moldar a essa nova
de dados no poder pblico, consubstanciado Consultas, soluo que prov uma interface realidade impe aos profissionais pblicos,
com a publicao de normas que apoiam de busca s informaes custodiadas e alm de uma anlise crtica sobre o senso
a troca de informaes entre os rgos produzidas pelo TCU de maneira simples e comum do funcionamento das organizaes
pblicos (vide Decreto 8.789/2016) e direta e que exemplifica o modo como um pblicas, uma honesta reflexo sobre seu
somado ao aumento na quantidade das grande volume de informaes pode ser papel enquanto parte de uma organizao
informaes disponveis (nem sempre de acessado por auditores de maneira muito que nunca estar suficientemente pronta, mas
qualidade), sugere o surgimento de iniciativas simples e em prol do seu trabalho cotidiano. que precisa entregar mais e funcionar melhor.
estruturantes visando a construo de uma Inspirado nesse exemplo e viabilizado a partir De modo pragmtico, j possvel
plataforma aberta de dados pblicos do Estado, de uma cooperao com o Ministrio da constatar bons resultados oriundos da
voltada anlise avanada de informaes Transparncia, Fiscalizao e Controladoria- execuo da estratgia de utilizao
por parte das organizaes pblicas e que Geral da Unio, o ALICE (Analisador de de informaes e anlise de dados nos
serviria como ponto de contato para as Licitaes, Contratos e Editais) produz e envia processos de trabalho do TCU. Afora os
iniciativas tanto no mbito das aes de mensagens eletrnicas automticas contendo alarmismos de tempos em tempos, mas
controle como na inteno de se transformar um apontamento de riscos sobre as licitaes mantendo viva a capacidade de se inspirar
em instrumento efetivo de gesto. publicadas no dia anterior, considerando e se comparar a uma realidade global e
Com o ambiente pronto, informaes aspectos como os valores envolvidos e indcios local, no h alternativa seno o constante
disponveis e estrutura montada, hora dos de irregularidades obtidos diretamente dos repensar a maneira como a misso das
produtos. textos dos editais em comparao com a instituies pblicas deve ser plenamente
jurisprudncia do TCU. cumprida. O aumento desejado da
III. Solues baseadas em informao Esses so dois exemplos de solues eficincia e da efetividade certamente
baseadas em informao que servem como envolve o pleno uso da informao, que
As organizaes globais que mais uma ferramenta de apoio aos processos demanda o envolvimento e o aumento
consolidaram seu funcionamento a partir de planejamento baseados em risco, alm da interao entre profissionais de perfis
de produo e consumo de informaes de fornecer insumos relevantes durante a complementares, a utilizao de novas
possuem verdadeira neurose em tentar execuo de fiscalizaes e instrues de tecnologias, a gesto das informaes e,
manter as suas informaes prontas para processos por meio da utilizao abrangente principalmente, uma mudana no modo de
uso da maneira mais simples possvel e a das informaes internas e externas planejar e executar os processos de trabalho.

16 Revista do TCU 137


Destaques

Nova Pesquisa de Jurisprudncia

Mesmo padro Pesquisa


adotado pelos mais simples,
Tribunais Superiores rpida e precisa

Destaque entre as principais mudanas:

- Pesquisa simultnea em todas as bases de dados de jurisprudncia;


- Operadores lgicos utilizados pelos tribunais superiores
(e, ou, adj, no, prox, mesmo e $);
- Novos recursos: histrico de pesquisa, ndice e navegao pelo resultado;
- Na Jurisprudncia Selecionada: pesquisa por referncia legal, navegao por rvore
de classificao e utilizao do Vocabulrio de Controle Externo (VCE)
para possibilitar a pesquisa por sinnimos.
- Saneamento do contedo das bases.

Maio/Agosto 2016 17
Artigos

Fundamentos de uma auditoria


em realidade misturada

Aroldo Cedraz de Oliveira  RESUMO


presidente doTribunal de Contas da
Unio, doutor em MedicinaVeterinria pela Com suporte em informaes colhidas no site da
Universitt Hannover Alemanha, mestre National Aeronautics and Space AdministrationNASA e do
em MedicinaVeterinria pela Universidade Jet Propulsion LaboratoryJPL, so analisadas as tcnicas
Federal de Santa Maria/RS, alm de de computao grfica empregadas no projeto OnSight
Professor Honorrio (h.c.) da Universidade NASA, aplicando-as auditoria de obras pblicas. Com
de Auditoria de Nanjing (NAU) e ex- base nesta reconstruo terica, estabelecem-se os alicer-
congressista por quatro legislaturas. ces de uma nova modalidade de auditoria, denominada
coordenador de edio da obraO MRAMixed Reality Auditing, ou auditoria em realidade
controledaadministraonaeradigital. misturada. Esta consiste em uma fiscalizao remota, em
tempo real, que utiliza imagens de cmeras digitais no local
de fiscalizao, transmitidas para Head-mounted Displays-
Francisco Osrio Ramos  HMDs, ou culos especiais de realidade misturada, utiliza-
servidor do Tribunal de Contas dos por um observador situado em uma localidade distinta.
da Unio, formado em Engenharia
Eltrica pela UnB, com mestrado Palavras-chave: Computao grfica. Realidade
em Fsica pela UnB. Professor de misturada. Renderizao. Frustum. Quadtree. Motor de
Fsica da UnB, de Engenharia Eltrica jogo. Fiscalizao de obras.
da UNIP e do IESB e de Cincia
da Computao do UniCEUB, 1. INTRODUO
ministrando as disciplinas Inteligncia
Artificial, Computao Grfica e O Jet Propulsion LaboratoryJPL, um centro tecnol-
Arquitetura de Computadores. gico de pesquisa e desenvolvimento ligado NASA, co-
meou a oferecer ao pblico, a partir de maro de 2016,
um passeio dirigido em uma rea do planeta Marte (JPL,
2016).Trata-se da misso Destination: Mars, uma exibio
interativa utilizando culos de realidade misturada, um
dos desdobramentos da realidade virtual. Os visitantes

18 Revista do TCU 137


Fundamentos de uma auditoria em realidade misturada // Artigos

retranca imagem

ctrl + Shift + click para liberar


retranca

podem percorrer vrios locais de Marte, reconstrudos a o campo de pesquisa da realidade virtual tem utilizado
partir de imagens reais enviadas para a Terra pelo veculo HMDs como dispositivos essenciais de exibio visual.
Curiosity, um jipe rob motorizado que explora a superfcie
do planeta vermelho desde agosto de 2012 (Ibid., 2016).
Figura 1:
Destination: Mars uma adaptao do projeto OnSi-
Dispositivo de vdeo HMD
ght, uma ferramenta de software para misses em Marte.
Os dados e imagens transmitidos diariamente pelo veculo
Curiosity so captados na Terra por trs antenas gigantes de
80m, sendo utilizado um dispositivo de realidade misturada
para transportar essas informaes da superfcie de Marte
at um laboratrio na Terra. Os cientistas so envolvidos
pelas imagens captadas nas proximidades do veculo em
Marte, podendo passear em torno de superfcies rochosas
ou agachar-se para examinar formaes geolgicas de dife-
rentes ngulos. O OnSight fornece aos cientistas um meio
de planejar e, juntamente com o veculo Curiosity, conduzir
operaes em Marte, explorando o planeta diretamente de
seus escritrios em Pasadena, na Califrnia (Ibid., 2016).

2. HMDS E REALIDADE DIGITAL

HMD ou Head-mounted display um dispositivo de


vdeo usado sobre a cabea como um capacete, contendo
Fonte: CANON (2016)
amplo visor, fones de ouvido e uma interface atravs da
qual o usurio pode experimentar um ambiente de reali-
dade virtual (MELZER; MOFFITT, 2011). Consiste em um A realidade virtual consiste em uma realidade mul-
visor transparente montado na cabea do observador, de timdia imersiva ou simulada por computador que replica
onde a informao apresentada sem exigir que o usurio um ambiente, simulando a presena fsica em locais do
olhe para fora de seu campo de viso normal, como ilustra mundo real ou de um mundo imaginrio, permitindo ao
a figura 1 (CANON, 2016). Desde os estudos pioneiros, usurio interagir com este mundo especfico. Em outras

Setembro/Dezembro 2016 19
Artigos

palavras, trata-se de um termo genrico, aplicvel a todos Modernamente, admite-se que as realidades virtu-
os tipos de experincias imersivas, criadas usando somen- al, aumentada e misturada podem ser reunidas sob uma
te contedo do mundo real, sinttico, ou um hbrido de denominao mais genrica: realidade digital.
ambos (LACKEY; SHUMAKER, 2016). So exemplos de
culos de realidade virtual o Oculus Rift, do Facebook; o 3. NVEL DE DETALHE E RENDERIZAO
Gear VR, da Samsung; e o Projeto Morpheus, da Sony.
Ainda segundo Lackey e Shumaker (2016), realidade A viso estereoscpica por computador (stereovision)
aumentada uma viso direta ou indireta de um ambien- consiste na extrao de informao 3D de imagens, como
te fsico do mundo real, cujos elementos so aumentados aquelas obtidas por uma cmera digital. Comparando a
ou suplementados com entradas geradas por sensores, tais cena a partir de dois pontos selecionados, a informao 3D
como som, vdeo, grficos ou dados de GPS. Trata-se de pode ser extrada a partir do exame das posies relativas
uma sobreposio de contedo sinttico sobre o mundo de objetos nos dois cenrios. As informaes detectadas a
real, em que este contedo no ligado a ele ou mesmo partir destas imagens estereoscpicas so lanadas sobre
parte dele. O contedo de mundo real e o de computao uma superfcie livre, criada com esta finalidade (AKENINE-
grfica no so capazes de interagir um com o outro. Consti- -MLLER; HAINES; HOFFMAN, 2008).
tuem-se em culos de realidade aumentada o Google Glass, Duas cmeras, afastadas horizontalmente uma da
o Daqri Smart Helmet e o Moverio, da Epson. outra, so usadas para obter duas vises diferentes de uma
Realidade misturada, tambm denominada realida- cena, de forma semelhante viso humana binocular.
de hbrida, consiste em uma fuso entre os mundos real Comparando estas duas imagens, a informao de profun-
e virtual para produzir novos ambientes e visualizaes, didade relativa pode ser obtida na forma de um mapa de
onde objetos fsicos e digitais coexistem e interagem em disparidade (disparity map), que codifica a diferena entre
tempo real. Trata-se de uma sobreposio de contedo sin- as coordenadas horizontais de pontos correspondentes
ttico sobre o mundo real do usurio, ligado a ele ou que nas imagens. Os valores neste mapa de disparidade so
com ele interage (Ibid., 2016). Contam-se entre os culos inversamente proporcionais profundidade da cena na
de realidade misturada o HoloLens, o Canon MREAL Dis- localizao correspondente dos pixels (Ibid., 2008).
play MD-10 e o Magic Leap. Utilizando a viso estereoscpica por computador,
para cada imagem que chega ao HMD do observador, ge-
rado um modelo 3D completamente novo por meio de algo-
ritmos automticos que constroem um modelo matemtica e
estatisticamente acurado da superfcie analisada, denomina-
do correlao estereoscpica (COLANER, 2016). Observan-
do duas imagens, encontrando as diferenas entre elas com
auxlio de um mapa de disparidade e usando um modelo
especfico de cmera, conclui-se quo distante cada ponto
se encontra e geram-se os mapas de alcance destas imagens.
Com a finalidade de acelerar o processamento das
imagens tratadas, todos os objetos que se encontram fora
do campo de viso do observador so removidos no pro-
cesso de renderizao (processo de gerar uma imagem a
partir de um modelo 2D ou 3D por meio de processamento
digital, consistindo em trs etapas bsicas: determinao
da cmera virtual, da superfcie visvel e das fontes de luz).
Somente os pixels que so visveis no frustum necessitam
ser renderizados. Todos os objetos que so visveis a par-
tir de um ponto em particular so pr-computados, sendo
imediatamente removidos todos os objetos no visveis,
reduzindo-se dessa forma, o nmero de objetos que inter-
ceptam o frustum (Ibid., 2016).
Frustum o campo de viso a partir do olho do ob-
servador, podendo ser representado por um volume espa-

20 Revista do TCU 137


Fundamentos de uma auditoria em realidade misturada // Artigos

cial imaginrio contendo tudo o que visvel em uma cena Segundo Lengyel (2004), organizar a geometria em
tridimensional. Pode ser representado por uma pirmide um quadtree traz o benefcio de que sempre que um n da
truncada constituda por seis planos. Quatro desses planos rvore puder ser determinado como no visvel, tem-se a
correspondem aos lados da tela, sendo chamados de frus- informao imediata de que todos os sub-ns daquele so
tum direito, esquerdo, de base e de topo. Os dois planos tambm no visveis e podem ser eliminados, melhorando
restantes so chamados planos frustum prximo e distante, o gerenciamento do nvel de detalhe.
e definem as distncias mnima e mxima em que os ob-
jetos de uma cena so visveis para o observador (DUNN; 4. O MOTOR DE JOGOS
PARBERRY, 2002). A figura 2 ilustra a geometria do frustum.
Para gerenciar o nvel de detalhe, a superfcie da Um motor para criao de jogos digitais como o
cena dividida em ladrilhos ou tiles de diferentes tama- Unity gera o software para integrao com o hardware
1

nhos, cada um com um determinado nvel de detalhe, se- envolvido, mostrando-se adequado para a interao do
guindo uma diviso da superfcie (espao 2D) conhecida usurio com a realidade misturada, visto que os culos
como quadtree (COLANER, 2016). disponveis possuem uma interface com o referido motor.
O quadtree consiste em uma estrutura de dados Utiliza-se um frame rate de 60 fps (quadros por segundo).
em rvore, na qual cada n interno possui exatamente Frame rate a frequncia (rate) com que um dispositivo de
quatro filhos, sendo utilizada para particionar um es- processamento de imagens as exibe de forma consecutiva,
pao bidimensional (2D), por exemplo, uma superfcie sendo estas chamadas de frames (quadros).
mediante subdiviso recursiva em quatro quadrantes, O motor de jogos Unity emprega a tcnica de mip-
regies ou clulas adaptveis. Cada clula ou reserva- maps, que consistem em sequncias de texturas do mun-
trio possui uma capacidade mxima. Quando esta ca- do 3D otimizadas e pr-calculadas, sendo cada uma delas
pacidade atingida, o reservatrio sofre uma diviso. A uma representao em resoluo progressivamente mais
estrutura da rvore segue a decomposio espacial do baixa da mesma textura, o que incrementa a velocidade
quadtree, ou seja, cada n sofre uma diviso em quatro de renderizao. Texturas mipmaps de alta resoluo so
sub-ns (LENGYEL, 2004). usadas para amostras de alta densidade, como objetos
A figura 3 exibe um quadtree construdo para prximos cmera. Texturas de baixa resoluo so usa-
uma rea contendo um nico objeto. A ilustrao das quando o objeto aparece mais distante. A tcnica de
direita mostra como a estrutura de dados correspon- mipmap pode melhorar o desempenho de processamento
dente organizada. Cada n possui quatro sub-ns. em at 33% no Unity.
Se nenhuma geometria de mundo interceptar um qua- Dessa forma, para os tiles mais prximos do ob-
drante, ento este quadrante no subdividido. Qual- servador, a resoluo torna-se mxima. Para tiles mais
quer quadrante que no contm objetos removido da distantes de seu campo de viso, a resoluo vai dimi-
rvore. Assume-se tambm que quaisquer quadrantes nuindo exponencialmente. Quando o observador dirige
ausentes esto vazios. seu olhar mais para frente, as texturas de resoluo menor

Figura 2: Figura 3:
Geometria do frustum Particionamento de um espao 2D com quadtree

Fonte: Dunn e Parberry (2002) Fonte: Lengyel (2004)

Setembro/Dezembro 2016 21
Artigos

so sobrepostas s texturas de mais alta resoluo. Com at agachar-se para examinar detalhes de diferentes pers-
esta tcnica, imagens locais captadas por cmeras do ve- pectivas e reunir achados de auditoria.
culo Curiosity podem ser combinadas com imagens de Para o caso de fiscalizaes em obras rodovi-
satlites orbitando Marte no local de observao, j que rias, podem ser observados remotamente, utilizando a
estas exibem uma resoluo que constante na regio Auditoria em Realidade MisturadaMRA, os seguintes
(COLANER, 2016). defeitos na rodovia: formao de panelas; afundamen-
Adicionalmente, se o observador clicar em algum tos; escorregamento de aterros; desgaste e fissuras em
detalhe da imagem podem ser exibidas outras imagens revestimentos; dispositivos de drenagem danificados;
com zoom, tomadas de outro ngulo ou mesmo de um exsudao em trecho de curva; remendo; degradao,
satlite orbital. Por seu turno, os culos de realidade ruptura e eroses de borda etc.
misturada (HMDs) suportam olhar fixo (gaze), gestos e No que diz respeito s fiscalizaes em obras
comandos de voz. ferrovirias, a observao visual em MRA pode de-
tectar os seguintes defeitos, tanto nas obras de terra-
5. AUDITORIA EM REALIDADE MISTURADA plenagem e de artes correntes e especiais, quanto na
plataforma ferroviria e na via permanente: apodreci-
A auditoria em realidade misturada consiste na mento; fratura ou excesso de furos em dormentes de
realizao de uma fiscalizao em que o auditor no madeira; queima por patinao; e corroso ou flamba-
est presente no local da obra, encontrando-se distan- gem da via em trilhos de ao. Pode ocorrer ainda des-
te, em outra localidade. Os sinais eletromagnticos, locamento longitudinal dos trilhos (ou arrastamento),
relativos s imagens da superfcie que so captadas desnivelamento nas juntas, desaparecimento de folga
por cmeras digitais no local, so transmitidos para entre eles, ocorrncia de vazio ou bolsa de contrao,
o HMD do auditor que recebe as referidas imagens e bem como o seu desalinhamento.
consegue percorrer a obra virtualmente e em tempo Quanto a fiscalizaes de obras de edificaes
real, mesmo estando a distncia, por exemplo, em com MRA, podem ser verificadas irregularidades na
uma sala na sede do TCU. Assim, auditores do TCU locao da obra (construo da estrutura na posio
podem realizar fiscalizaes de obras em locais dis- incorreta); na terraplenagem (escavao, transporte e
tantes de Braslia sem abandonarem a sede na Capi- aterro); nas fundaes (fissuras nos tubules ou nas sa-
tal Federal. patas); nas estruturas de concreto armado ou protendido
O auditor , portanto, envolvido pelas mltiplas (incorrees nos prumos de cantos externos, pilares e
imagens captadas nas proximidades da obra, todas com poos de elevadores); na alvenaria de vedao (trincas
elevado nvel de detalhe, alm de vrias posies e ngulos ou rachaduras, utilizao de tijolos danificados, locao
diferentes, podendo passear em torno dessa superfcie ou das paredes e dos vos das esquadrias); na cobertura

22 Revista do TCU 137


Fundamentos de uma auditoria em realidade misturada // Artigos

(vazamentos, telhas quebradas, inclinao do telhado


e calhas), bem como nos revestimentos (placas soltas).
Podem ser inseridas no software de realidade mis-
turada todas as informaes relativas aos projetos bsico
e executivo, como quantidade de materiais, qualidade
dos mesmos e preos por unidade para serem conferidas
com as constataes visuais das obras sob fiscalizao,
simplesmente encarando um alvo e utilizando controles
baseados em gestos para selecionar os comandos na barra
de menu. Da mesma forma, pode ser inserida uma rgua
virtual para medir a distncia entre dois pontos da obra.
No mbito internacional, a auditoria de recursos
provenientes de auxlios, no caso de grandes desastres
naturais, constitui-se em um tema recorrente no Interna-
tional Journal of Government Auditing da INTOSAI. Com as
tcnicas de auditoria em realidade misturada, especialis-
tas do mundo inteiro, entre auditores de EFSs, gelogos,
sismlogos, fsicos e ambientalistas podero acompanhar
as ocorrncias in loco, sem abandonar seus pases, simul-
taneamente e em tempo real.

6. CONCLUSO REFERNCIAS

Este estudo teve como objetivo analisar as tcni- AKENINE-MLLER,T.; HAINES, E.; HOFFMAN, N. Real-Time Rendering.
cas de computao grfica empregadas no projeto On- 3rd ed. Massachusetts: A K Peters; Florida: CRC Press, 2008.
Sight NASA, aplicando-as auditoria de obras pblicas.
Com esteio nesta reconstruo terica, estabeleceram- CANON. MREAL Display MD-10, 2016. Disponvel em: <https://
-se os alicerces de uma nova modalidade de auditoria goo.gl/wBeCih>. Acesso em: 14 set. 2016.
denominada MRA Mixed Reality Auditing, ou auditoria
em realidade misturada. COLANER, S. VR and AR go to Mars: Interview with NASA Scientists
A criao deste novo conceito de auditoria pelo Jeff Norris and Alex Menzies.Toms Hardware, NewYork, April 7, 2016.
Tribunal de Contas da Unio constitui-se em um gran- Disponvel em: <https://goo.gl/gvLN7H>. Acesso em: 14 set. 2016.
de avano no campo da fiscalizao de obras pblicas
e ambiental, com impacto imenso na forma como este DUNN, F.; PARBERRY, I. 3D Math Primer for Graphics and Game
trabalho realizado at o momento, porquanto suprime Development. Texas: Wordware Publishing, Inc., 2002.
as distncias e a necessidade de viagens de especialistas
aos locais de obras e desastres naturais, com evidente eco- JPL.Mixed RealityTechnology Brings Mars to Earth. Jet Propulsion
nomia de tempo e recursos para viagens e hospedagens, LaboratoryNASA, California, March 30, 2016. Disponvel em:
bem como demais despesas concernentes. <https://goo.gl/RYrCrZ>. Acesso em: 14 set. 2016.
As bases lanadas no presente estudo servem
como diretrizes para que o TCU realize parceria com a LACKEY, S.; SHUMAKER, R. Virtual, Augmented and Mixed Reality:
NASA, efetivando projeto conjunto na rea de interesse 8th International Conference on Human-Computer Interaction.
ou mesmo inicie projeto prprio, incluindo o desenvol- 1st ed. New York: Springer, 2016.
vimento do software necessrio, bem como a seleo do
HMD mais adequado e a consequente integrao com LENGYEL, E. Mathematics for 3D Game Programming & Computer
o hardware a ser utilizado. Graphics. 2nd ed. Massachusetts: Charles River Media Group, 2004.

NOTAS MELZER, J. E.; MOFFITT, K. Head-mounted Displays: Designing


for the User. South Carolina: Create Space Independent
1 Disponvel em: <http://unity3d.com>. Publishing, 2011.

Setembro/Dezembro 2016 23
Artigos

Plataforma de servios de dados


abertos do TCU: crowdsourcing,
nuvem cvica e aplicativos cvicos

Monique Louise de Marcelo Pacote 


Barros Monteiro  servidor do Tribunal de Contas da
servidora do Tribunal de Contas da Unio, mestre e bacharel em Cincia
Unio, mestre e bacharel em Cincia da Computao pela UnB. Possui
da Computao pela UFPE. Possui 12 especializao em Desenvolvimento
certificaes profissionais: Big Data de Aplicativos Mveis pela Uniara,
Certified Science Professional, Big Data alm de 17 certificaes profissionais:
Certified Professional, SOA Certified PMP, CBDP, SOACP, SOACC, CSM, CSD,
Governance Specialist, SOA Certified SCJD, SCJP, SCJA, SCEA (I), SCBCD,
Architect, SOACP, PSM, SAFe Agilist, SCWCD, RUPF, IRIP, CTFL, ITILF e
Oracle Master Java EE 5 Enterprise Oracle SQL Expert. Autor de livro na
Architect, MTS, MSP, SCJP e IBM OOAD. rea de Tecnologia da Informao.

Remis Balaniuk 
servidor do Tribunal de Contas da
Unio, ps-doutor em Realidade
Virtual pela Stanford University, doutor
em Informtica pelo Institut National
Polytechnique de Grenoble - Frana,
mestre em Cincias da Computao
pela Universidade Federal do Rio Grande
do Sul e tecnlogo em Processamento
de Dados pela Universidade de Braslia.
Atualmente professor e pesquisador
da Universidade Catlica de Braslia.

24 Revista do TCU 137


Plataforma de servios de dados abertos do TCU: crowdsourcing, nuvem cvica e aplicativos cvicos // Artigos

retranca imagem

ctrl + Shift + click para liberar


retranca

RESUMO lizada pelo governo para que todos possam encontrar


e utilizar os dados e as informaes pblicas. O portal
Este artigo descreve o trabalho de desenvolvi- inclui dados relativos execuo oramentria, s infor-
mento, disponibilizao e sustentao de uma plata- maes cartogrficas e sobre unidades de atendimento,
forma de exposio de dados abertos e de coleta de alm de possuir indicadores e estatsticas diversas.
informaes por meio de crowdsourcing, tendo por base Dentre os fatores responsveis por catalisar ini-
seu uso por aplicativos cvicos. Como resultados espe- ciativas como o Portal Brasileiro de Dados Abertos1
rados da implementao dessa plataforma, podemos est a Lei 12.527 Lei de Acesso Informao Pblica,
citar as oportunidades de 1) centralizao e disponibili- sancionada em 18 de novembro de 2011. De acordo
zao de dados abertos e 2) obteno de contribuies e com as diretrizes fixadas pelo dispositivo legislativo
percepes dos cidados. Tais informaes podero ter em questo, a regra geral consiste em classificar as in-
grande utilidade tanto para a definio de indicadores formaes de interesse coletivo produzidas ou custo-
para servios e polticas pblicas como tambm para diadas pelo Estado como pblicas, visando a assegurar
aumentar o conhecimento a respeito dos anseios do o direito fundamental de acesso informao. Assim,
cidado em diferentes localidades e esferas populacio- informaes devem ser classificadas como sigilosas em
nais, incluindo a percepo da sociedade com relao casos excepcionais, quando for imprescindvel segu-
aos servios a ela prestados. rana da sociedade e do Estado.
O Tribunal de Contas da Unio (TCU) tem em
Palavras-chave: aplicativos cvicos, web services, seu planejamento aes para promover a divulgao
crowdsoursing, nuvem cvica, dados abertos de dados abertos por meio dos seus veculos de infor-
mao. No contexto desse conjunto de aes, desde o
1. INTRODUO incio de 2015, o TCU tem internalizado bases de dados
provenientes do Instituto Nacional de Estudos e Pesqui-
Um tema recorrente na Administrao Pblica sas Educacionais Ansio Teixeira (INEP), do Cadastro
no Brasil e em outras naes o compartilhamento de Nacional de Estabelecimentos de Sade (CNES)2, do
dados abertos para maior transparncia em relao s Ministrio do Desenvolvimento Social e Agrrio (rela-
aes governamentais. tivas assistncia social), do Sistema Nacional de Em-
Atualmente, temos no Brasil, por exemplo, o Por- prego (SINE), do Portal de Compras do Governo Federal
tal Brasileiro de Dados Abertos , ferramenta disponibi- (SIASG/Comprasnet)3, do Sistema Integrado de Admi-

Setembro/Dezembro 2016 25
Artigos

nistrao Financeira do Governo Federal (SIAFI)4, do Ciente desse cenrio, o TCU adotou um modelo
Cadastro Nacional de Empresas (CNE)5, dentre outros. de atuao no ecossistema de dados abertos que assu-
Aps a internalizao das bases, os dados recebi- miu como premissa a necessidade de oferecer aos de-
dos so disponibilizados para a sociedade, por meio de senvolvedores de tecnologias cvicas uma plataforma de
consulta por usurios finais ou por sistemas de software. servios na qual seus aplicativos possam acessar remota-
A seguir, detalhada a metodologia adotada para esta mente dados tratados e atualizados de uma forma mais
disponibilizao dos chamados dados abertos. adequada e otimizada para processamento por sistemas
de software clientes. Outra premissa que a plataforma
2. METODOLOGIA oferecida permita aos aplicativos armazenar os dados
por eles gerados.
Tradicionalmente, ferramentas como o Portal Primeiramente, os dados recebidos a partir das
Brasileiro de Dados Abertos, apesar de sua utilidade, bases citadas na introduo so persistidos em um ban-
tm apresentado como caracterstica principal a dis- co relacional corporativo.
ponibilizao das informaes de forma esttica e/ou Concluda a etapa de persistncia dos dados na
bruta (ex.: planilhas, arquivos em formato XML, CSV ou infraestrutura de armazenamento do TCU, eles esto
HTML), com grande quantidade de registros (ex.: plani- prontos para serem acessados tanto por usurios finais
lhas com dezenas de milhares de linhas ou arquivos com como por aplicativos atravs de web services. Segundo
centenas de megabytes). Porm, dados eletrnicos gover- Erl et al. (2012), a partir de uma perspectiva geral, um
namentais brutos so, em geral, de difcil compreenso servio um programa de software que disponibiliza sua
para o cidado comum. Faz-se necessria, portanto, a funcionalidade por meio de uma interface tcnica publi-
interveno de pessoas, grupos e/ou empresas, com ca- cada, denominada contrato do servio. Considerando que
pacidade e disponibilidade para desenvolver aplicativos tais servios de software podem ser implementados por
e outros elementos tecnolgicos que possam traduzir o meios diversos, utilizaremos neste artigo a denomina-
dado governamental aberto em produtos de interesse e o web service para nos referirmos a servios disponveis
utilidade pblica ou privada. na World Wide Web.
Grande parte dos conjuntos de dados disponi- Cada web service responsvel por agrupar e ex-
bilizados de difcil apropriao tambm pelos desen- por um conjunto de operaes relacionadas. Tais opera-
volvedores de tecnologias cvicas, j que essas bases es podem ser acessadas por aplicaes desenvolvidas
de dados, oferecidas tipicamente em formato bruto, externamente para a obteno dos dados por meio de
comumente tm um baixo valor informativo, alm de protocolos padronizados, de acordo com os padres da
serem disponibilizadas na forma de arquivos estticos. World Wide Web. Tais protocolos incluem, por exem-
Tal caracterstica exige do desenvolvedor um trabalho plo, Hypertext Transfer Protocol (HTTP) (FIELDING et
peridico de transferncia, entendimento, tratamento, al., 1999).
adequao e posterior disponibilizao em aplicativos. A figura 1 mostra o conceito de web service e suas
Tambm requisito comum a necessidade de infraes- operaes em nvel conceitual. Temos dois web services
trutura de TI remota e disponvel continuamente, o que representados e cada um deles responde por determi-
implica em custos de hospedagem (ex.: contratao de nado tema, agrupando operaes de consulta que se-
servios de nuvens) com os quais os desenvolvedores ro executadas sobre a base de dados persistida. Cada
precisam arcar. Tais dificuldades limitam o potencial de operao, por sua vez, admite o recebimento de par-
uso de dados abertos pelos aplicativos cvicos. metros que permitem filtrar, dinamicamente, os crit-

Web service
Web service Escolas Estabelecimentos de sade
Figura 1:
Representao em alto nvel de dois web services. Um agrupa Operaes:
Operaes:
operaes de consulta sobre escolas, e outro, operaes - listar escolas de acordo com
- listar estabelecimentos de acordo
critrios parametrizveis
de consulta sobre estabelecimentos de sade - listar escolas por localizao com critrios parametrizveis
- exibir detalhes de uma - listar estabelecimentos por
determinada escola localizao
- listar avaliaes para - exibir detalhes de um
determinada escola estabelecimento

26 Revista do TCU 137


Plataforma de servios de dados abertos do TCU: crowdsourcing, nuvem cvica e aplicativos cvicos // Artigos

rios de busca, bem como os atributos e a quantidade de Sade: informaes de especialidades mdicas,
dados retornados. estabelecimentos de sade, profissionais, me-
Com relao ao formato dos dados retornados dicamentos e servios especializados, todos no
pelas operaes, utilizamos JSON JavaScript Object mbito de servios pblicos.
Notation (ECMA, 2013). Tal formato compreensvel
por usurios finais, uma vez que textual. Alm disso, Assistncia social: informaes de centros de
por ser semiestruturado, amplamente utilizado por referncia e centros de referncia especializada
aplicativos para dispositivos mveis e outros tipos de de assistncia social (respectivamente, CRAS e
sistemas computacionais, garantindo ampla interope- CREAS).
rabilidade e facilidade de manipulao por desenvol-
vedores, principalmente em comparao com formatos Empregos: informaes de postos do SINE.
proprietrios, binrios ou de maior complexidade,
comumente encontrados em portais tradicionais de Educao: informaes de educao, incluindo
dados abertos. basicamente dados cadastrais dos estabelecimen-
tos educacionais e de seus recursos.
3. DESENVOLVIMENTO
Denominaremos o conjunto de web services acima
Os web services foram projetados inicialmente citados de nuvem cvica. Daqui em diante, para nos
como ferramenta de apoio para o desenvolvimento de referirmos especificamente ao conjunto de operaes
aplicativos mveis cvicos, no contexto do Projeto BE- definidas no contrato ou interface disponibilizado pe-
PiD (Programa Educacional Brasileiro de Desenvolvi- los web services, utilizaremos o acrnimo API, sigla para
mento para IOS), por meio de uma parceria entre o TCU Application Programming Interface.
e a Universidade Catlica de Braslia (UCB)6. A parceria A API inicialmente proposta e disponibilizada
em questo envolveu o desenvolvimento de aplicativos seguiu os requisitos esperados pelos aplicativos Mapa
cvicos por parte de alunos da referida universidade, que da Sade e Nossa Escola, desenvolvidos por alunos
utilizassem os canais de informao fornecidos pelos da UCB.
web services desenvolvidos pelo TCU. Em virtude principalmente das necessidades de
Foram especificados e desenvolvidos conjuntos coletar feedback de cidados prtica conhecida mun-
de web services para disponibilizao dos seguintes gru- dialmente como crowdsourcing os aplicativos foram
pos de informaes: desenvolvidos seguindo um modelo de rede social, de-

Setembro/Dezembro 2016 27
Artigos

mandando, portanto, a existncia de um cadastro de mento da mquina administrativa pblica, das neces-
usurios e de avaliaes de servios pblicos por eles sidades e da percepo do cidado. O crowdsourcing,
fornecidas. A partir da, surgiu o metamodelo para quando utilizado como uma prtica de transparncia,
aplicativos cvicos, um conjunto adicional de web ser- permite que grandes quantidades de dados ganhem
vices que permite consultar, incluir, alterar e excluir in- sentido, podendo gerar ideias novas para o desenvolvi-
formaes relacionadas a usurios, aplicativos, grupos mento de projetos para sociedade.
de usurios, postagens, hashtags, notificaes etc. Esse conhecimento servir futuramente como
Adicionalmente, para que o mesmo modelo pu- insumo no planejamento de aes de controle do TCU.
desse ser adotado tanto para sade pblica como para Por fim, a coleta e o armazenamento dos dados em um
educao, bem como para outras reas de atuao do formato definido pelo prprio TCU facilita iniciativas
Estado, possvel que usurios enviem avaliaes, sob futuras de anlise estatstica e minerao de dados, tan-
a forma de postagens, de entidades genricas denomi- to preditiva como prescritiva, podendo incluir desde
nadas aqui de objetos. Assim, um usurio pode avaliar anlises mais simples at aplicaes mais complexas
um objeto, que pode ser, por exemplo, uma escola ou baseadas em aprendizado de mquina.
um hospital, a depender do contexto de utilizao de- Como exemplo de aplicativo cvico, as figuras 2 a
terminado pelo aplicativo em uso. 3 mostram capturas de tela do aplicativo Mapa da Sa-
As massas de dados geradas pelo crowdsourcing de, que possui recursos de busca por estabelecimentos
cvico sero fontes inestimveis de informao, em par- de sade em um raio de localizao, exibio de dados
ticular para a concepo de indicadores que permitiro detalhados de cada estabelecimento (incluindo, embora
a descoberta de conhecimento a respeito do funciona- no seja exibido nas capturas, listagem de especialida-

Figura 2: Figura 3:
Mapa da Sade busca de estabelecimentos de sade em Mapa da Sade detalhe de um estabelecimento
raio, exibidos em um mapa (visualizao em modo satlite)

Fonte: Elaborao prpria Fonte: Elaborao prpria

28 Revista do TCU 137


Plataforma de servios de dados abertos do TCU: crowdsourcing, nuvem cvica e aplicativos cvicos // Artigos

des mdicas e quantitativo de profissionais por funo) exemplo que 456 o identificador da escola
e ainda uma funcionalidade para que o usurio avalie a interno aplicao (ex.: chave em um banco de
qualidade do atendimento prestado. dados);

4. ASPECTOS TECNOLGICOS POST <http://contas.tcu.gov.br/appCivi-


coRS/pessoas> {nome:Jos da Silva,
A nuvem cvica foi desenvolvida segundo o estilo email: josedasilva@tcu.gov.br, dataNas-
REST sigla para Representational State Transfer (FIEL- cimento:12/12/1950}: cadastra um novo
DING, 2000). REST engloba um estilo arquitetnico usurio, enviando suas informaes no corpo
para a construo de aplicaes e APIs e, grosso modo, da mensagem;
prov um mecanismo no qual, no contexto dos web ser-
vices aqui referenciados, cada operao de um web service PUT <http://contas.tcu.gov.br/appCivicoRS/
pode ser representada da seguinte forma: pessoas/789> {nome:Jos da Silva, email:
novoemail@tcu.gov.br, dataNascimen-
Mtodo HTTP (GET | POST | PUT | DELETE) + URI (Uniform Resource Identifier) to:12/12/1950}: atualiza os dados de um
usurio existente, enviando suas informaes
no corpo da mensagem.
Cada um dos mtodos acima representa um
dos possveis mtodos ou operaes suportados pelo A API documentada no formato Swagger7. Tal
protocolo HTTP, a serem executados sobre um recur- formato permite no apenas a visualizao do contrato
so identificado por uma URI. Os mtodos possuem a da nuvem cvica (operaes suportadas, formatos das
seguinte semntica, resumidamente: URIs, formato dos dados trafegados, parmetros para
cada operao) como tambm o teste das funcionali-
GET: Utilizado para recuperar informaes (ex.: dades. Alm disso, a documentao gerada dinami-
operaes de consulta); camente, sendo atualizada a cada mudana no contrato
da API.
POST: Utilizado para criar novos recursos (ex.: As figuras 4 a 6 ilustram os contratos da API do
cadastrar novo usurio); metamodelo para aplicativos cvicos e sua visualizao
por meio da interface Swagger. As outras APIs sade,
PUT: Utilizado para atualizar recursos (ex.: atua- educao, assistncia social e empregos possuem in-
lizar dados cadastrais de um usurio j existente); terfaces de documentao semelhantes.

DELETE: Utilizado para excluir recursos (ex.: ex- 5. CONCLUSO E PERSPECTIVAS FUTURAS
cluir um usurio).
Os aplicativos Mapa da Sade, Nossa Escola,
Exemplos de chamadas a operaes da API que Meu Remdio, Mami e Vacin App constituem exem-
podem ser executadas por aplicativos: plos reais de aplicaes desenvolvidas tendo por base
a API disponibilizada. Esto disponveis nas lojas App
GET <http://contas.tcu.gov.br/nossaEscolaRS/ Store e Google Play.
escolas/123>: recupera as informaes da esco- Em 2016, o TCU promoveu mais uma oportuni-
la identificada externamente pela URL <http:// dade de validar o modelo para aplicativos cvicos aqui
contas.tcu.gov.br/nossaEscolaRS/escolas/123>. descrito: o Desafio de Aplicativos Cvicos8. Trata-se
Considera-se neste exemplo que 123 o iden- de uma hackathon para que desenvolvedores externos
tificador da escola interno aplicao (ex.: chave inscrevam aplicativos que faam uso dos web services
em um banco de dados); disponibilizados.
Na poca em que este artigo foi escrito, o concurso
DELETE <http://contas.tcu.gov.br/appCivicoRS/ estava em andamento, com cerca de noventa aplicativos
pessoas/456>: excluir o usurio identificado ex- inscritos. Ao longo do Desafio, mantivemos um canal
ternamente pela URI <http://contas.tcu.gov.br/ aberto diretamente com os desenvolvedores, atravs de
appCivicoRS/pessoas/456>. Considera-se neste caixa postal institucional e de um site no GitHub9. Por

Setembro/Dezembro 2016 29
Artigos

meio desse canal, recebemos mais de quarenta sugestes Embora tenha sido proposta e implementada pelo
de ajustes e extenses s operaes disponibilizadas pela TCU, a plataforma de web services disponibilizada est
API. A maioria das sugestes foram implementadas, e aberta a contribuies e parcerias. Seu sucesso depende-
algumas encontram-se na lista de melhorias a serem im- r da convergncia de esforos e ideias na construo de
plementadas na prxima verso da API. solues inovadores e teis ao cidado. Se bem-sucedida,

Figura 4:
Exemplo de listagem de web services (metamodelo para aplicativos cvicos)

Fonte: Elaborao prpria

Figura 5:
Exemplo de listagem de operaes de um web service

Fonte: Elaborao prpria

30 Revista do TCU 137


Plataforma de servios de dados abertos do TCU: crowdsourcing, nuvem cvica e aplicativos cvicos // Artigos

Figura 6:
Exemplo de detalhamento de contrato de uma operao

Fonte: Elaborao prpria

trar resultados que podero contribuir para a melhoria REFERNCIAS


dos servios e polticas pblicas, provendo novos servios
e recursos para a sociedade como um todo. BOOTH, D. et al. (Eds.). W3C. Web Services Architecture.
February 2004. Seo 1.4. Disponvel em: <https://www.
NOTAS w3.org/TR/ws-arch/#whatis>. Acesso em: 10 out. 2016.

1 Disponvel em: <http://dados.gov.br>. Acesso em: 10 out. 2016. BRASIL. Lei n 12.527, de 18 de novembro de 2011. Dispe
sobre os procedimentos a serem observados pela Unio,
2 Disponvel em: <http://dados.gov.br/dataset/cnes>. Acesso Estados, Distrito Federal e Municpios, com o fim de garantir
em: 10 out. 2016. o acesso a informaes, e d outras providncias. Dirio
Oficial da Unio, Braslia, DF, 18 nov. 2011. Edio extra.
3 Disponvel em: <http://www.comprasgovernamentais.gov.br/
acesso-aos-sistemas/comprasnet-siasg>. Acesso em: 10 out. 2016. ECMA. The JSON Data Interchange Format. Geneva, out. 2013.
Disponvel em: <http://www.ecma-international.org/publications/
4 Disponvel em: <http://www.tesouro.fazenda.gov.br/siafi>. files/ECMA-ST/ECMA-404.pdf>. Acesso em: 10 out. 2016.
Acesso em: 10 out. 2016.
ERL, T. et al. SOA with REST: Principles, Patterns & Constraints
5 Disponvel em: <http://cne.smpe.gov.br/>. Acesso em: 10 out. for Building Enterprise Solutions with REST. New Jersey:
2016. Prentice Hall, 2012. p. 24.

6 Disponvel em: <http://www.bepiducb.com.br/index.html>. FIELDING, R. T. Architectural styles and the design of network-
Acesso em: 10 out. 2016. based software architectures. 2000. Dissertation submitted
in partial satisfaction of the requirements for the degree of
7 Disponvel em: <http://swagger.io/>. Acesso em: 10 out. 2016. Doctor of Philosophy in Information and Computer Science.
University of California, Irvine, 2000.
8 Disponvel em: <http://portal.tcu.gov.br/desafio-aplicativos-
civicos/>. Acesso em: 10 out. 2016. FIELDING, R. et al. Hypertext Transfer Protocol HTTP/1.1.
Junho 1999. Disponvel em: <https://www.w3.org/Protocols/
9 Disponvel em: <https://github.com/>. Acesso em: 10 out. 2016. rfc2616/rfc2616.txt>. Acesso em: 10 out. 2016.

Setembro/Dezembro 2016 31
Artigos

A recuperao semntica
da informao no contexto
do controle externo

Mrcia Martins de Arajo RESUMO


Altounian 
servidora do Tribunal de Nos sistemas de recuperao da informao
Contas da Unio, bacharel em (SRI), as tcnicas de base sinttica tm sido suplanta-
Biblioteconomia e Documentao das pela crescente explorao das tcnicas de recupe-
pela UnB, com especializao rao semntica, que possibilitam a compreenso dos
em Gesto do Conhecimento conceitos em seu contexto e finalidade. Algumas tec-
pelo Instituto Blaise Pascal e nologias tm contribudo para essa realidade, como a
Arquitetura e Organizao da marcao semntica dos dados, utilizada na web se-
Informao pela UFMG. mntica, o processamento de linguagem natural e as
redes neurais. O tesauro tambm apresenta-se como
um componente semntico que impacta no desempe-
Beatriz Pinheiro de Melo nho dos SRI. Tesauros so ferramentas da linguagem
Gomes  artificial em um domnio especfico, formados por um
servidora do Tribunal de sistema de conceitos relacionados entre si. Este artigo
Contas da Unio, bacharel em apresenta a aplicao do tesauro do TCU, denominado
Biblioteconomia e Documentao Vocabulrio de Controle Externo, em alguns sistemas
pela UnB, com especializao de informao corporativos.
em Gesto Estratgica do
Conhecimento e Inteligncia Palavras-chave: Semntica. Recuperao da in-
Empresarial pela PUC/Paran. formao. Tesauro.

1. INTRODUO

A recuperao da informao (RI) um campo de


interesse comum da cincia da computao e da cincia da
informao que se preocupa em desenvolver e estudar os
aspectos relativos a eficincia e eficcia das buscas em um
sistema de informao, de modo que os resultados sejam

32 Revista do TCU 137


A recuperao semntica da informao no contexto do controle externo // Artigos

retranca imagem

ctrl + Shift + click para liberar


retranca

coerentes com sua expresso de busca e, sobretudo, rele- do conhecimento e objetivam solucionar problemas de
vantes para o usurio do sistema. ambiguidade inerentes s palavras usadas cotidianamente.
Efetuar buscas em grandes repositrios de informa- O Vocabulrio de Controle Externo, tesauro do
es no estruturadas e no padronizadas torna-se uma TCU, foi desenvolvido com o objetivo de padronizar o
tarefa rdua, levando muitas vezes a ambiguidades, a con- tratamento de contedos especializados e contribuir com
tedos fora de contexto e at mesmo a no recuperao da a recuperao semntica no contexto do controle externo,
informao desejada. As ferramentas de busca, ao fazerem alm de conferir maior agilidade e preciso s pesquisas nos
uso da linguagem natural, necessitam de conhecimento sistemas de informao do Tribunal.
sobre o significado das expresses utilizadas e das relaes
entre elas, o que possibilita contextualizao e tratamen- 2. SEMNTICA
to de fenmenos lingusticos que afetam a qualidade da
recuperao. O termo semntica, tradicionalmente estudado
Para o processo de classificao e recuperao de in- na lingustica e na filosofia, vem sendo amplamente usa-
formao, vrios mtodos automticos vm sendo desen- do nas mais variadas reas de atuao, especialmente nas
volvidos com o objetivo de obter respostas relevantes para relacionadas tecnologia da informao. A chamada web
qualquer pesquisa realizada. At o momento, a maioria de- semntica (WS), que tem origem na expanso da web e nas
les baseia-se em aspectos sintticos e estatsticos, levando limitaes dos instrumentos de busca baseados em sintaxe,
em considerao frequncia e distribuio de palavras pre- certamente um dos motivos para essa associao.
sentes em documentos. Por se basear nos aspectos sintticos Mas o que semntica? A palavra tem origem no
da informao, a classificao realizada por esses mtodos termo grego semantik, e muitas acepes podem ser encon-
ainda est muito distante, em termos de qualidade, da reali- tradas de acordo com a perspectiva utilizada, pois h, entre
zada com base na indexao dos assuntos dos documentos outras vertentes, semntica textual, cognitiva, lexical, formal
feita por especialistas. e argumentativa. Em geral, todas convergem num mesmo
Recentemente, vm sendo explorados novos mto- ponto: estudam significado, ou significao. A ampla varie-
dos de classificao automtica de documentos baseados dade de possibilidades atesta que o estudo do significado
em aspectos semnticos da linguagem que se referem ao pode ser feito de vrios ngulos.
significado dos termos em seu contexto e finalidade. Uma Trs propriedades bsicas destacam-se na semn-
dessas iniciativas consiste no uso de instrumentos de repre- tica so elas a sinonmia, a antonmia e a polissemia. A
sentao de relacionamentos semnticos e conceituais como sinonmia a diviso da semntica que estuda a relao en-
os tesauros, que se caracterizam por representar domnio tre expresses lingusticas que tm o mesmo sentido. Por

Setembro/Dezembro 2016 33
Artigos

exemplo, garota e menina so palavras substantivas que as particularidades de palavras que, ao contrrio, tm grafia
possuem um mesmo significado, remetendo figura de uma e pronncia semelhantes, mas significados diferentes so
jovem; assim tambm acontece com verbos como renun- exemplos: eminente/iminente e absolver/absorver.
ciar, recusar e rejeitar, que transmitem a ideia de repul- Finalmente, a semntica estuda ainda as proprie-
sa. Ressaltando-se a rara ocorrncia de sinonmia perfeita, dades de denotao e conotao das palavras. Denotao
pode-se afirmar que sinonmia a relao entre palavras a propriedade que uma palavra tem de limitar-se ao seu
e expresses que possuem sentido e significado comuns. prprio conceito por exemplo, o termo estrelas em as
Se por um lado a sinonmia estuda as palavras com sig- estrelas do cu. Conotao a propriedade que uma pala-
nificados semelhantes na lngua, a antonmia trata do estudo vra tem de ampliar-se no seu campo semntico, dentro de
das palavras que indicam sentidos opostos. Na mesma linha um contexto, gerando vrias possibilidades interpretativas
do exemplo anterior, podemos citar os substantivos garota por exemplo, o mesmo termo estrelas em as estrelas
e senhora, bem como os verbos renunciar e aceitar do cinema.
tratam-se todos de termos com significao oposta. Quando transportamos os conceitos aqui explorados
Tambm possvel que uma mesma palavra assu- para o que hoje conhecemos como WS, fica fcil perceber
ma significados diferentes nesse caso, o contexto em que que estamos falando de promover melhorias nos proces-
estiver inserida ditar o seu sentido. Um bom exemplo do sos de representao e recuperao da informao na web.
cotidiano a palavra manga, da qual rapidamente pode- Desde 1990, a web caracterizada por usar linguagens de
mos pensar em duas acepes bastante diferentes: uma fruta marcao que objetivam a apresentao e a leitura por pes-
e uma parte de pea do vesturio. Esse um exemplo co- soas e por mecanismos de busca baseados em algoritmos
mum de polissemia, termo que, formado pelo prefixo poli com orientao sintaxe. O uso da semntica pode ampliar
(muitos) e pelo sufixo semos (significados), a parte a possibilidade de associaes dos documentos a seus sig-
da semntica que estuda as significaes que uma palavra nificados por meio de metadados descritivos. Portanto, a
assume em determinado contexto lingustico. questo do significado na semntica fundamental WS.
H ainda outras duas propriedades semnticas, na Das diversas linhas de estudo relacionadas semn-
mesma linha de estudo da significao, que merecem ser tica, a da semntica formal parece ser a mais pertinente tec-
citadas: a homonmia e a paronmia. A homonmia estuda nologia da informao. Trs aspectos principais permeiam
a relao de duas ou mais palavras que, apesar de terem os estudos sobre semntica formal:
significados diferentes, tm a mesma forma e o mesmo
som o caso de termos como concerto/conserto e rio/rio 1. O princpio da composicionalidade, que estabe-
(substantivo/verbo), entre tantos outros. A paronmia estuda lece que o significado das sentenas depende do

34 Revista do TCU 137


A recuperao semntica da informao no contexto do controle externo // Artigos

significado das palavras que as compem ou seja,


o significado do todo funo do significado das par-
tes e da combinao sinttica entre elas. Para saber o
significado de uma sentena, necessrio conhecer o
significado das suas partes, bem como as regras que
definem sua combinao.

2. A condio de verdade, que determina as condies


em que tal sentena verdadeira. Nesse contexto,
saber o significado de uma sentena equivale a co-
nhecer suas condies verdade, o que no o mesmo
que saber o seu valor verdade, ou seja, se o fato
verdadeiro ou falso.

3. Os modelos em semntica, em que so construdos


sistemas simples, em relao aos sistemas comple-
xos que se desejam estudar. Constri-se uma teoria
lgica para o modelo e, se os resultados forem razoa-
velmente positivos em relao ao sistema complexo,
diz-se que o sistema simples um bom modelo; caso indexao tradicional, em que se determinam os ter-
contrrio, ele abandonado. mos descritivos ou caracterizadores dos documentos;

A semntica formal considera ainda o fato de que indexao full-text (ou indexao do texto todo), em
as lnguas naturais so utilizadas para falar sobre objetos, que todos os termos que compem o documento
indivduos, fatos, eventos e propriedades, descritos como fazem parte do ndice;
externos prpria lngua assim, a referencialidade um de
seus aspectos fundamentais. Por essa razo, na semntica indexao por tags (por partes do texto), em que ape-
formal o significado entendido, por um lado, como uma nas algumas partes do texto so escolhidas para gerar
relao com a linguagem, e, por outro, com aquilo sobre o as entradas no ndice (somente as consideradas mais
que a linguagem fala. importantes ou mais caracterizadoras).
A semntica formal procura responder s seguin-
tes perguntas: o que representam ou denotam as ex- As buscas so geralmente feitas atravs de termos
presses lingusticas?, como calculamos o significado fornecidos pelo usurio ou escolhidos por ele entre alguns
de expresses complexas a partir dos significados de apresentados. Esses termos podem significar o assunto ou
suas partes? classe a que pertencem os documentos desejados (na inde-
xao tradicional) ou os termos que devem estar presentes
3. RECUPERAO SEMNTICA nos documentos desejados (nas indexaes full-text e por
DA INFORMAO tags).
Nos sistemas convencionais de busca, as tcnicas
Os sistemas de recuperao de informao (SRI) utilizadas so de base sinttica. Entretanto, quando a busca
procuram representar o contedo dos documentos e apre- do usurio envolve informao cuja relevncia no pode
sent-los ao usurio de maneira a atender rapidamente sua ser dada por palavras-chave, esse modelo no satisfaz. Ob-
necessidade de informao. serva-se, portanto, a crescente explorao das informaes
Para tanto, a RI pesquisa tcnicas para tratamen- semnticas, o que possibilita compreenso dos conceitos
to, organizao e busca de contedos a partir do uso de em seu contexto e finalidade.
padres. As ferramentas de RI, geralmente, trabalham A marcao semntica dos dados na origem um
com tcnicas de indexao capazes de indicar e aces- exemplo das novas tecnologias utilizadas para a RI. A WS
sar rapidamente documentos de um banco de dados tem-se utilizado dessa estratgia para implementar padres
textual. de metadados que adicionem aos dados informaes signifi-
Existem trs tipos principais de indexao: cativas sobre seus contextos, marcando-os semanticamente.

Setembro/Dezembro 2016 35
Artigos

A explorao da semntica intrnseca dos dados bus- As redes neurais, por sua vez, so uma representao
ca fundamentos da lingustica e da cincia da informao que tm muitas caractersticas comuns memria huma-
para ampliar o universo de informaes recuperadas e a na: podem lidar com informao incompleta ou distorcida,
aferio de contextos, por meio do uso de estruturas da permitem generalizaes automticas e exibem contedo
linguagem natural, como os sintagmas verbais e nominais, baseado no contexto. Essas funes possibilitam vrias apli-
e de ferramentas de representao de relacionamentos se- caes na RI guardada na memria humana, essenciais em
mnticos e conceituais. contextos precisos, e so essas aplicaes que se pretendem
Tcnicas de processamento de linguagem natural reproduzir no ambiente computacional.
(PLN) que permitam a construo de algoritmos para a Um componente semntico que impacta o desem-
busca de informao relevante em grande quantidade penho de um SRI o tesauro, ferramenta da linguagem
de documentos esto em crescente demanda. Mtodos artificial de um domnio conhecido, construdo por espe-
eficientes de PLN devem fundamentar-se em conhe- cialistas para representar atravs de conceitos o contedo
cimentos bsicos sobre propriedades da linguagem e informacional, especificando as relaes entre eles. Trata-se
principalmente sobre a semntica dos conceitos. Desse de um sistema de conceitos que se relacionam entre si e so
contexto emerge a ideia de memria semntica, tema que representados por termos.
tem sido objeto de teorias psicolingusticas e uma fonte Cada termo tem obrigatoriamente vinculao com
rica para desenvolvimento de modelos computacionais outro, e essa vinculao que forma a estrutura do tesauro.
que pretendem se aproximar dos processos mentais usa- Os termos so utilizados pelos indexadores no momento
dos pelo crebro humano na compreenso da linguagem. da indexao e devem ser disponibilizados ao usurio no
Alm dos algoritmos, os modelos computacionais neces- momento da RI.
sitam de dados que representam o conhecimento sobre Silveira e Ribeiro-Neto (2004) estudam o uso au-
a linguagem e as associaes de senso comum entre os tomtico de tesauro para melhorar resultados de buscas
conceitos lexicais e suas propriedades. Atualmente, isso na web, por meio de ranking baseado em conceitos que
muito difcil, pois essa tarefa somente pode ser produzida tem sido estudado para a RI em domnios especficos. Em
e verificada por humanos. A memria semntica trabalha experimento realizado pelos autores, os termos de busca
com um lxico mental ou seja, conceitos e unidades de utilizados em um SRI na web foram comparados aos con-
conhecimento e contm informaes sobre as relaes ceitos de um tesauro, utilizado para encontrar conceitos
entre conceitos, formando uma rede conceitual de ele- relacionados. Cada conceito relacionado foi interpretado
mentos conectados uns com outros por diferentes tipos de forma independente e processado separadamente, e en-
de associaes. to combinado em uma rede bayesiana1, para permitir um

36 Revista do TCU 137


A recuperao semntica da informao no contexto do controle externo // Artigos

ranking final, baseado em conceitos. O objetivo era verificar temente dos outros, o seu permite que se chegue palavra
se a informao acrescida de conceito aumentaria a mdia mais adequada ou que melhor se ajuste s necessidades
da preciso dos resultados da busca. do escritor, sem que, de incio, ele saiba qual ela (GOMES,
No estudo foram utilizadas seis fontes de informa- 1996).
o: palavra chave, conceito, termo especfico, termo geral, Nos anos 1960, o cientista da informao Brian Cam-
termo relacionado e sinnimo. Os autores verificaram, entre pbell Vickery apresentou quatro significados para o termo
outras coisas, que a utilizao de um tesauro especfico para tesauro na literatura de sua rea, sendo que o significado
um domnio especfico fundamental para a melhoria do mais comum o de uma lista alfabtica de palavras, em
desempenho das buscas. que cada palavra seguida de outras relacionadas a ela (VI-
O experimento demonstrou o aumento de 30% na CKERY, 1980 apud MOREIRA; ALVARENGA; OLIVEIRA,
mdia da preciso dos resultados das buscas e, portanto, 2004).
prope a viso de que os tesauros melhoram tanto a revo- Currs (1995, p. 88) define tesauro como uma lin-
cao como a preciso em um SRI. guagem especializada, normalizada, ps-coordenada, usada
com fins documentrios, onde os elementos lingusticos que
4. TESAURO a compem termos, simples ou compostos encontram-se
relacionados entre si sinttica e semanticamente.
De acordo com Moreira, Alvarenga e Oliveira (2004), Tristo (2004, p. 167) o define como vocabulrio
o termo tesauros se origina do grego thesaurs e significa de termos, que nada mais do que uma seleo de termos,
tesouro ou repositrio. Esse termo surgiu com a publicao baseados em anlise de conceitos, na qual se define o termo
do dicionrio analgico de Peter Mark Roget, em Londres, geral, de maior abrangncia, e sua relao com termos mais
em 1852, intitulado Thesaurus of English words and phrases. especficos, que representam os conceitos menores. A Or-
O termo tambm designa vocabulrio, dicionrio ou lxi- ganizao Nacional de Padres de Informao especifica:
co, porm o dicionrio de Roget se diferenciava dos outros
por ser um vocabulrio organizado de acordo com seu sig- Um tesauro um vocabulrio controlado organi-
nificado, e no por ordem alfabtica. A obra teve o mrito zado em uma ordem preestabelecida e estruturado de
de estabelecer a denominao para vocabulrios que rela- modo que os relacionamentos de equivalncia, de ho-
cionam seus termos por meio de algum tipo de relao de mografia, de hierarquia, e de associao entre termos
significado. sejam indicados claramente e identificados por indi-
Em sua introduo, Roget define seu dicionrio cadores de relacionamento padronizados empregados
como uma classificao de ideias e explica que, diferen- reciprocamente. As finalidades primordiais de um te-

Setembro/Dezembro 2016 37
Artigos

sauro so (a) facilitar a recuperao dos documentos lanada no final da dcada de 1970 pela cientista da infor-
e (b) alcanar a consistncia na indexao dos docu- mao Ingetraut Dahlberg, agregando princpios terminol-
mentos escritos ou registrados de outra forma e outros gicos relacionados ao contedo conceitual e sua definio.
tipos, principalmente para sistemas de armazenamen- Para Campos e Gomes (2006), essa uma teoria consolidada
to e de recuperao de informao ps-coordenados. para a determinao do que se entenderia por menor unida-
(ANSI/NISO Z39.19, 2003 apud SALES; CAF, 2008). de em um tesauro: o conceito representado por um termo.
Alm disso, Moreira (2003) aponta como inovao o uso de
Conforme Campos e Gomes (2006), a evoluo na definies para o posicionamento do conceito no sistema.
construo de tesauros baseia-se em duas vertentes, a ame- Brscher (2010) aponta como funo dos tesauros a
ricana e a europeia. Os tesauros elaborados nos Estados traduo da linguagem dos documentos, dos indexadores
Unidos a partir da dcada de 1950 foram fruto do desen- e dos pesquisadores a uma linguagem controlada, usada na
volvimento ocorrido a partir do cabealho de assuntos para indexao e na RI em sistemas de informao. Conforme
o unitermo, passando de um sistema pr coordenado para Sales e Caf (2008), o ANSI/NISO Z39.19, de 2003, ressalta
sistemas ps-coordenados. que os tesauros no so utilizados somente pelos especia-
Silva (2008) afirma que na mesma poca, na Inglater- listas da informao no momento da indexao, mas tam-
ra, o Classification Research Group (CRG) a partir da Teo- bm por usurios da informao no momento da busca de
ria da Classificao Facetada, desenvolvida pelo matemtico documentos.
e bibliotecrio indiano Shiyali Ramamrita Ranganathan Segundo Caf e Brscher (2011), nos tesauros as re-
ampliou as categorias de personalidade, matria, energia, laes semnticas so estabelecidas por meio da anlise
espao e tempo (PMEST) e desenvolveu diversas tabelas das caractersticas ou propriedades dos conceitos, as quais
de classificao, dando origem a uma tcnica denominada permitem identificar diferenas e semelhanas que eviden-
Thesaurofacet, que permitiu melhor posicionamento do ciam determinados tipos de relacionamentos. Um termo
conceito no sistema de conceitos em uma dada rea de as- presente em um tesauro pode ser caracterizado de manei-
sunto, por meio do uso de suas categorias. Conjuntamente, ras diferentes dependendo do assunto em questo e tam-
tambm embasaram os tesauros terminolgicos a Teoria da bm do tipo de sistema que se deseja construir. A estrutura
Classificao Facetada, a Teoria do Conceito e alguns prin- dos tesauros compreende trs tipos principais de relaes
cpios terminolgicos. Esses instrumentos tm nas caracte- semnticas para relacionar os termos: a hierarquia, a equi-
rsticas do conceito um elemento essencial para evidenciar valncia e a associao.
as relaes entre os conceitos e seu posicionamento no sis- Nas relaes hierrquicas os termos so organizados
tema, alm de defini-lo. em gnero/espcie. As relaes de equivalncia so de sino-
A citada Teoria do Conceito, voltada para o referente nmia, ou seja, h termos sinnimos presentes no tesauro
e originalmente chamada Teoria Analtica do Conceito, foi e deve-se indicar qual o termo adequado para representar

38 Revista do TCU 137


A recuperao semntica da informao no contexto do controle externo // Artigos

determinado conceito. As relaes de associao, por sua Relao hierrquica: relacionamento que expri-
vez, apresentam associaes entre os termos, sem especi- me os graus ou os nveis de superordenao e de
ficar qual tipo de relao propriamente existe so apenas subordinao dos termos; o termo superordenado
termos que se relacionam de alguma forma. representa o gnero de que o termo subordinado
Nos tesauros so tratados ainda casos de ambigui- tipo ou espcie.
dade (possibilidade de que uma comunicao lingusti-
ca se preste a mais de uma interpretao) e de polissemia Relao associativa: reunio de conceitos afins que
(possibilidade de que uma palavra comporte mais de um merecem estar relacionados, mas que no esto li-
significado). gados por relacionamentos de equivalncia nem de
hierarquia.
5. VOCABULRIO DE CONTROLE EXTERNO
No VCE, cada termo corresponde a um conceito,
O tesauro do TCU, denominado Vocabulrio de e todos os termos possuem relacionamentos, sendo o re-
Controle Externo (VCE), foi lanado em 2015 e objetiva lacionamento determinado pelo significado do termo. As
ser instrumento de controle terminolgico que possibilite relaes entre termos ajudam a compreender os conceitos
padronizao no tratamento tcnico e maior preciso na especficos de controle externo e de reas correlatas que
recuperao dos contedos presentes nos sistemas de in- compem o tesauro.
formao do TCU. Bem alm de uma lista hierarquizada de palavras,
O inter-relacionamento dos conceitos no VCE o VCE composto de trs partes distintas, mas inter-re-
foi expresso por meio de relaes de trs tipos: de equi- lacionadas. A primeira formada por palavras chave, re-
valncia, hierrquicas e associativas. O objetivo das lativas s reas de atuao do Tribunal, acompanhadas
relaes apresentar os descritores em seu contexto por definies e sinnimos; a segunda, correspondente
semntico. clientela do TCU e s Entidades de Fiscalizao Superiores
(EFS) associadas Organizao Internacional de Entidades
Relao de equivalncia: se termos sinnimos Fiscalizadoras Superiores (Intosai), traz informaes como
ou quase sinnimos so considerados, para efeito histrico, nomes alternativos, CNPJ e instituies afins. A
do vocabulrio, como representando um mesmo terceira parte contempla a toponmia nacional formada
conceito, um deles escolhido como descritor e os pelas regies, mesorregies, unidades federativas e mu-
demais so proibidos. nicpios brasileiros.

Setembro/Dezembro 2016 39
Artigos

6. APLICAES DO VCE pesquisados, uma vez que a ferramenta estruturada em


um sistema de conceitos inter-relacionados por hierarquia,
6.1 E-JURIS equivalncia e associao.

O e-Juris uma ferramenta corporativa que faz parte 6.2 BIBLIOTECA DIGITAL DO PORTAL DO TCU
do e-TCU, o qual agrega todos os sistemas de instruo e
controle de processos do Tribunal, contendo a mesma l- Repositrios corporativos de conhecimento pres-
gica, estrutura e apresentao dos demais sistemas de pro- tam-se a disseminar a informao produzida internamente,
cessos. Alm disso, integrado com o portal do TCU, com a permitir o acesso cultura organizacional e a subsidiar a
o sistema corporativo de busca e com outros sistemas do informao transformada em conhecimento. Sendo mais
TCU, como o Sagas e o VCE. As premissas adotadas para que um depsito de documentos, os repositrios podem
o novo sistema foram seletividade, qualidade, relevncia, atuar de forma decisiva, dando suporte ao desenvolvimento
tempestividade e simplicidade. de novos produtos e servios e formao e capacitao
A principal finalidade do e-Juris a divulgao das da fora de trabalho da organizao. Alm disso, costu-
teses relevantes, do ponto de vista jurisprudencial, que fun- mam servir de fonte oficial de informao aos parceiros e
damentaram acrdos do TCU, por meio de publicaes colaboradores, amparar as atividades cotidianas e auxiliar
peridicas (boletins e informativos) e de formao e dispo- o processo decisrio.
nibilizao, para pesquisas e consultas, da base de dados da No TCU, a biblioteca digital um dos repositrios
jurisprudncia do Tribunal. Com isso, o novo sistema unifica corporativos de conhecimento de mais fcil acesso e uti-
processos de trabalho que antes eram feitos separadamente lizao. Desenvolvida para organizar, tratar e disseminar
e sem integrao. informaes que possam gerar novos conhecimentos,
As teses jurisprudenciais relevantes so representa- a biblioteca digital permite a insero de material com
das por enunciados, sob formato de ementa. Os enunciados diversas tipologias documentais. Assim, no mesmo am-
representam precedentes jurisprudenciais, no o entendi- biente possvel encontrar livros, trabalhos acadmicos,
mento ou a jurisprudncia prevalecente do Tribunal sobre apresentaes, cartilhas, peridicos, acordos, contratos,
determinada questo. expedientes e normativos, alm de imagens diversas e
A adoo da indexao pelo e-Juris permite maior outros tipos de recursos. A ferramenta permite que sejam
preciso na recuperao dos enunciados. Alm da previso estabelecidos dois nveis de acesso aos contedos deposi-
de busca por termos sinnimos, o VCE agrega ao sistema tados: possvel permitir o livre acesso a documentos de
a funcionalidade de sugesto de assuntos correlatos a ser carter pblico, da mesma forma que possvel limitar o

40 Revista do TCU 137


A recuperao semntica da informao no contexto do controle externo // Artigos

acesso a documentos de cunho interno ou que possuam destaque numa era em que produzimos conhecimento por
algum tipo de restrio. meio de variados colaboradores e parceiros: as wikis fer-
A insero de documentos no ambiente realizada ramenta de tecnologia conhecida como software social e
descentralizadamente, e existem gestores de contedo res- desenhada com um conjunto de caractersticas que permi-
ponsveis pela aprovao do que ficar disponvel no repo- tem a criao e a organizao de conhecimento no mundo
sitrio. A biblioteca digital possui tambm um formulrio colaborativo. A utilizao das wikis tem se revelado uma
de entrada de dados que pode ser usado em todo o Tribu- soluo de baixo custo, com alto grau de eficincia, para o
nal. Esse formulrio composto de metadados controlados fomento criao cooperativa de conhecimento dentro das
e possibilita a descrio do contedo, com elementos tais organizaes.
como ttulo, autoria e data. Mais do que isso, requer que os O ambiente wiki a evoluo do conceito de compu-
documentos sejam classificados em uma rvore temtica ter supported cooperative work (CSCW), que surgiu da necessi-
e que os assuntos tratados sejam traduzidos por palavras- dade de que organizaes tenham pessoas trabalhando em
-chave oriundas de um vocabulrio controlado. lugares fsicos diferentes, ao mesmo tempo que precisando
Em outras palavras, a biblioteca digital do TCU cons- alcanar resultados rpidos conjuntamente; ou seja, surgiu
titui-se num repositrio corporativo de conhecimento que para facilitar a comunicao e a produtividade de grupos
exige que as informaes sejam classificadas e indexadas. remotos.
Para a indexao dos contedos, o ambiente est integrado Desde 2009, o TCU utiliza o software livre Media-
ao VCE. Alm disso, como a biblioteca tambm est integra- wiki para gerir uma wiki de controle externo e acesso res-
da ferramenta de pesquisa textual do portal corporativo, trito aos seus servidores. Trata-se de um importante espao
possvel fazer buscas diretamente no portal e recuperar o colaborativo de construo de conhecimento que rene tu-
contedo depositado no ambiente dessa biblioteca. toriais informais e verbetes especializados oriundos do VCE.
A Wiki pode ser acessada e editada por todos os ser-
6.3 SISTEMA ORIENTAR vidores; eles agregam informaes aos verbetes e tutoriais
em tpicos que abrangem norma, legislao e doutrina. A
O Sistema Orientar foi concebido para ser ferramenta Wiki importante ferramenta de gesto do conhecimento,
de orientao, gesto e disseminao do conhecimento sobre na medida em que fornece informaes e documentos teis
controle externo. Ele permite que qualquer servidor do Tribu- ao trabalho cotidiano dos auditores, de acordo com sua rea
nal possa encaminhar perguntas sobre temas pr-seleciona- de atuao, e se configura como um genuno ambiente de
dos de controle externo, tais como auditoria, planejamento, inteligncia coletiva da organizao.
contas anuais, tomada de contas especial, representao,
denncia, solicitao, avaliao de qualidade, cobrana exe- 6.5 FUTURAS APLICAES
cutiva, normas de controle externo e demais procedimentos
processuais, alm de tirar dvidas sobre o sistema Fiscalis. O VCE apresenta ainda potenciais aplicaes em
Aps a seleo do tema, o sistema direciona a per- diversos sistemas de informao do Tribunal. A integrao
gunta para a unidade responsvel pela rea. A partir da cole- da terminologia na ferramenta de busca do portal do TCU,
tnea das perguntas e respostas, cada unidade respondente por meio da adoo do vocabulrio controlado tanto para
cria automaticamente um banco de dados de perguntas mais o tratamento quanto para a busca, fator primordial para o
frequentes (FAQ), que fica armazenado no sistema e dispo- aumento de preciso e rapidez na RI.
nvel para consultas e pesquisas por todos os servidores. Outra possibilidade de uso do VCE como dicio-
Diversas unidades do TCU j foram cadastradas nrio em softwares de indexao automtica de grandes
como unidades respondentes, e o sistema integrado ao volumes de documentos, servindo de parmetro termino-
VCE. A adoo do vocabulrio controlado permite maior lgico na rea de controle externo. Essa funcionalidade j
preciso na recuperao da informao desejada, uma vez foi testada durante o processo de indexao automtica
que so atribudos, tanto s perguntas quanto s respostas, de enunciados, constante em uma prova de conceito para
termos de indexao que representam os assuntos tratados. aquisio de software de data mining e anlise semntica
de dados.
6.4 WIKI DE CONTROLE EXTERNO Em um cenrio ideal, vislumbra-se que o Tribunal
adote padres, a exemplo de metadados de assunto e da
Entre as diversas possibilidades de armazenar o co- ferramenta de controle terminolgico, para garantir a me-
nhecimento de uma instituio, uma em especial merece lhoria do desempenho de seus SRI.

Setembro/Dezembro 2016 41
Artigos

NOTAS MOREIRA, A. Tesauros e ontologias: estudo de definies


presentes na literatura das reas das cincias da computao
1 Redes bayesianas constituem um modelo grfico que representa e da informao, utilizando-se o mtodo analtico-sinttico.
simplesmente as relaes de causalidade das variveis de um Perspectivas em Cincia da Informao, Belo Horizonte, v. 8, n. 2,
sistema. Em resumo, redes bayesianas, tambm conhecidas p. 216-226, jul/dez. 2003.
como redes de opinio, redes causais e grficos de dependncia
probabilstica, so modelos grficos para raciocnio (concluses) _____; ALVARENGA, L.; OLIVEIRA, A. P. Thesaurus and ontology: a
baseado na incerteza, em que os ns representam as variveis study of the definitions found in the Computer and Information
(discretas ou contnuas), e os arcos representam a conexo direta Science Literature, by means of an analytical-synthetic method.
entre eles (SILVEIRA; RIBEIRO NETO, 2004). Knowledge Organization, v. 31, n. 4, p. 231-244, 2004.

REFERNCIAS SALES, R., CAF, Lgia. Semelhanas e Diferenas entre Tesauros e


Ontologias. DataGramaZero - Revista de Cincia da Informao, v.9
ALMEIDA, M. B.; SOUZA, R. R. Avaliao do espectro semntico de n.4 Ago 2008.
instrumentos para organizao da informao. Encontros Bibli
Revista Eletrnica de Biblioteconomia e Cincia da Informao, SILVA, A. Anlise das relaes semnticas em tesauros jurdicos
Florianpolis, v. 16, n. 31, p. 25 50, 2011. Disponvel em: <http://mba. brasileiros: orientaes das normas e aplicao prtica. 2013.
eci.ufmg.br/downloads/11963-60907-1-PB.pdf>. Acesso em: 23 Trabalho de Concluso de Curso (Bacharel em Biblioteconomia)
nov. 2016. Centro de Cincias da Educao, Universidade Federal de
Santa Catarina, Florianpolis, 2013. Disponvel em: <https://
ALTOUNIAN, M.; ZAULI, A. A semntica na recuperao da informao repositorio.ufsc.br/bitstream/handle/123456789/103801/
na web: novas tendncias. 2013. Trabalho apresentado como TCC_Aline_da_Silva_20131PDFA.pdf?sequence=1>. Acesso
requisito parcial para aprovao na disciplina Recuperao da em: 23 nov. 2016.
Informao, Escola de Cincia da Informao, Universidade Federal
de Minas Gerais, Belo Horizonte, 2013. SILVA, D., SOUZA, R., ALMEIDA, M.B. Ontologias e vocabulrios
controlados: comparao de metodologias para construo. Cincia
BRSCHER, M. Elaborao de tesauros. Braslia, 2010. da Informao, v. 37, n. 3, p. 60-75, set/dez. 2008.

CAF, L.; BRSCHER, M. Organizao do conhecimento: teorias SILVEIRA, M. L.; RIBEIRO-NETO, B. Concept-based ranking: a case study
semnticas como base para estudo e representao de conceitos. in the juridical domain. Information Processing & Management,
Informao & Informao, Londrina, v. 16, n. 3, p. 25 51, jan./jun. 2011. Doha, v. 4, n. 5, p. 791 805, Sept. 2004.

CAMPOS, M. L. A.; GOMES, H. E. Metodologia de elaborao de SOUZA, A. et al. Recuperao semntica de objetos de aprendizagem:
tesauro conceitual: a categorizao como princpio norteador. uma abordagem baseada em tesauros de propsito genrico. In:
Perspectivas em Cincia da Informao, Belo Horizonte, v. 11, n. 3, SIMPSIO BRASILEIRO DE INFORMTICA NA EDUCAO, 19., 2008,
p. 348 359, set./dez. 2006. Uberlndia. Anais Uberlndia: SBIE, 2008. p. 603 612.

CAPRI, D.; GARRIDO, I.; DUARTE, R. Recuperao semntica da SOUZA, A.; ROCHA, R. Sistemas de recuperao de informaes
informao. 2009. Trabalho apresentado como requisito parcial e mecanismos de busca na web: panorama atual e tendncias.
para aprovao na disciplina Recuperao da Informao, Centro Perspectivas em Cincia da Informao, Belo Horizonte, v. 11, n. 2, p.
de Cincias da Educao, Universidade Federal de Santa Catarina, 161 173, maio/ago. 2006. Disponvel em: <http://www.scielo.br/pdf/
Florianpolis, 2009. Disponvel em: <http://pt.slideshare.net/ pci/v11n2/v11n2a02.pdf>. Acesso em: 23 nov. 2016.
doritchka/angel-recuperao-semntica-da-informao>. Acesso em:
23 nov. 2016. SZYMANSKI, J.; DUCH, W. Information retrieval with semantic memory
model. Cognitive Systems Research, Kalamazoo, v. 14, n. 1, p. 84 100,
CURRS, E. Tesauros: linguagens terminolgicas. Braslia, DF: CNPq; Apr. 2012. Disponvel em: <http://ethologie.unige.ch/etho5.10/
Ibict, 1995. themes/semantic.memory/szymanski.duch.2011.information.
retrieval.in.sematic.memory.neural.network.models.pdf>. Acesso
GOMES, H.E. Classificao, tesauro e terminologia; fundamentos em: 23 nov. 2016.
comuns. Rio de Janeiro: UNIRIO, 1996.

42 Revista do TCU 137


Artigos

Geotecnologias e o monitoramento
dos Objetivos de Desenvolvimento
Sustentvel pelas Entidades
de Fiscalizao Superior

Rherman Radicchi Teixeira Leonardo Pereira Garcia 


Vieira  servidor do Tribunal de
servidor do Tribunal de Contas da Unio, lotado
Contas da Unio, lotado na no Centro de Pesquisa e
Secretaria de Fiscalizao Inovao/ISC. Graduado
de Infraestrutura Porturia, em Administrao pela
Hdrica e Ferroviria, Universidade de Braslia,
formado em Agronomia pela com especializao em
Universidade de Braslia. Educao Corporativa.

Andr Delgado de Souza  Erick Fonseca dos Santos 


servidor do Tribunal de servidor do Tribunal de Contas da
Contas da Unio lotado na Unio, mestrando em computao
Secex/PB, bacharel, mestre e aplicada, com foco em viso
doutor em Engenharia Civil computacional e reconhecimento
pela Universidade Federal de de objetos em imagens de satlite,
Pernambuco, com doutorado associado ao projeto GeoControle,
sanduche pela Universidade do TCU, para acompanhamento
Tcnica de Berlim. de obras de infraestrutura por
meio de sensoriamento remoto.
formado em computao.

43 Revista do TCU 137


Geotecnologias e o monitoramento dos Objetivos de Desenvolvimento Sustentvel pelas Entidades de Fiscalizao Superior // Artigos

retranca imagem

ctrl + Shift + click para liberar


retranca

RESUMO 1. INTRODUO

Dentre as iniciativas propostas pela Organiza- A Agenda para o Desenvolvimento Sustentvel


o das Naes Unidas (ONU) para que os Objetivos de 2030 da Organizao das Naes Unidas (ONU)
de Desenvolvimento Sustentvel (ODS) superem lana um desafio sobre as atividades desempenhadas
os desafios encontrados pelos Objetivos de Desen- pelas Entidades de Fiscalizao Superior (EFS). Recen-
volvimento do Milnio (ODM), est a utilizao de tes resolues da Assembleia Geral da ONU enfatizam
dados geoespaciais e investimentos em capacita- o papel-chave das EFS e da International Organization
o para utilizar as novas tecnologias. Alm disso, of Supreme Audit Institutions (Intosai) no alcance dos
Normas Internacionais das Entidades Fiscalizadoras Objetivos de Desenvolvimento Sustentvel (ODS) (NA-
Superiores (ISSAI) reconhecem a importncia da ES UNIDAS, 2016).
capacitao de seus servidores para atender s no- A Resoluo da ONU A66/209 de 2011 (Id.,
vas demandas. A proposta de ao concreta deste 2011) salienta que as EFS desempenham um papel
trabalho visou apoiar a estratgia de investimento importante na promoo da eficincia, eficcia, res-
em geotecnologias para o monitoramento dos ODS ponsabilizao e transparncia da administrao p-
pelas Entidades de Fiscalizao Superior (EFS). Essa blica, que propiciam o desenvolvimento nacional em
atividade foi desempenhada por meio da reviso da direo s ODS. Alm disso, a Resoluo A69/228 de
literatura sobre as referncias tcnicas das Naes 2014 (Id., 2014a) refora explicitamente o papel-chave
Unidas e da Intosai que possam contribuir com a das EFS na Agenda 2030.
utilizao de geotecnologias para o monitoramento No relatrio do 23 Simpsio das Naes Unidas/
dos ODS pelas EFS. Intosai (Id., 2015d) sobre o papel das EFS na Agenda
2030, destaca-se a importncia do uso intensivo de an-
Palavras-chave: Objetivos de Desenvolvi- lise de dados1(data analytics). Dentre as iniciativas pro-
mento Sustentvel. Entidades de Fiscalizao Supe- postas pela ONU para que os ODS superem os desafios
rior. Geotecnologias. Sensoriamento remoto. Sistema encontrados pelos Objetivos de Desenvolvimento do
de Informao Geogrfica (SIG). Global Positioning Milnio (ODM), est a utilizao de dados geoespaciais
System (GPS). Intosai. ISSAI. Padres internacionais (Id., 2015c). Alm disso, as Normas Internacionais das
em auditoria. Competncias tcnicas. Capacitao. Entidades Fiscalizadoras Superiores (ISSAI), ressaltam a
Diagnstico. possibilidade de aplicao das geotecnologias s diver-

Setembro/Dezembro 2016 44
Artigos

sas fases da auditoria (INTERNATIONAL ORGANISA- mento, anlise e disponibilizao de informaes geor-
TION OF SUPREME AUDIT INSTITUTIONS, 2013b). referenciadas. Dentre elas tm-se o Global Navigation
No entanto, inexistem nas fontes bibliogrficas Satellite System (GNSS), o Sensoriamento Remoto e os
pesquisadas obras com o objetivo de sistematizar con- Sistemas de Informaes Geogrficas (SIG). O GNSS
juntamente as referncias tcnicas da ONU em relao permitiu s pessoas saberem com preciso a localiza-
ao uso de geotecnologias para o monitoramento dos o delas na superfcie terrestre, destacando-se entre os
ODS e referncias tcnicas da Intosai que abordem o sistemas dessa natureza o Global Positioning System
tema geotecnologias. (GPS) (SOUZA, 2016).
Pelos motivos expostos e visando auxiliar o uso Souza (2016, p. 41) caracteriza o sensoriamen-
de novas tecnologias aplicadas ao controle, este artigo to remoto pela utilizao de sensores para captao
se prope a fazer a reviso da literatura de referncias e registro a distncia, sem contato direto, da energia
tcnicas das Naes Unidas e da Intosai que possam refletida ou absorvida pela superfcie do alvo. A partir
contribuir com o uso de geotecnologias para o monito- da utilizao de programas computacionais possvel
ramento dos ODS pelas EFS. realizar o armazenamento, a manipulao e a anlise
de dados gerados por essa tecnologia. Os veculos a-
2. GEOTECNOLOGIAS COMO reos no tripulados (VANT), pequenas aeronaves no
FERRAMENTAIS DE APOIO AO tripuladas, podem realizar monitoramento por meio de
MONITORAMENTO DOS ODS imagens areas e filmagens (SOUZA, 2016).
Nesse contexto, os SIG so sistemas que re-
As geotecnologias favorecem a abordagem uni- alizam o tratamento computacional de dados geo-
versal e padronizada para o monitoramento de outras grficos (SOUZA, 2016, p. 41). Cmara (2015, p. 2)
informaes relevantes, tais como indicadores econmi- explica que a principal diferena de um SIG para um
cos, educacionais, ambientais e de sade. A informao sistema de informao convencional sua capacidade
geogrfica permite a anlise e a modelagem de dados, de armazenar tanto os atributos descritivos como as
a criao de mapas e a deteco e o monitoramento de geometrias dos diferentes tipos de dados geogrficos.
suas alteraes ao longo do tempo de forma consistente Com os SIG possvel integrar dados de diversas fon-
e padronizada (NAES UNIDAS, 2015a). tes, permitindo a realizao de anlises mais comple-
Souza (2016, p. 40) descreve as geotecnologias xas (SOUZA, 2016). Podem-se inserir, em uma nica
como o conjunto de tecnologias para coleta, processa- base, dados provenientes de diferentes fontes e com-

45 Revista do TCU 137


Geotecnologias e o monitoramento dos Objetivos de Desenvolvimento Sustentvel pelas Entidades de Fiscalizao Superior // Artigos

bin-los, com apoio de algoritmos de manipulao e O relatrio Indicators and a monitoring fra-
anlise (CMARA, 2005). mework for the sustainable development goals (NA-
O documento The millennium development go- ES UNIDAS, 2015c) destacou as oportunidades
als: report 2015 (NAES UNIDAS, 2015e) sintetiza trazidas pela revoluo dos dados, por meio de big data,
os avanos, os desafios e as lies aprendidas durante dados sociais e geofsicos e novas formas de compar-
os quinze anos de monitoramento dos ODM. Ao tratar tilhamento de dados. Alm disso, esse relatrio trouxe
sobre os desafios para o monitoramento, afirma-se que uma srie de exemplos de formas de suporte das geo-
grandes lacunas de dados, dados de baixa qualidade, da- tecnologias aos ODS, conforme demonstra o Anexo 1
dos desatualizados e no desagregados em importantes ao final deste artigo.
dimenses figuram entre os principais desafios. Dentre Autores como Jeffrey Sachs (2012) apontam uma
as iniciativas propostas para superar esses desafios, est srie de diferenas entre os ODM e os ODS, conforme
a utilizao de dados geoespaciais (NAES UNI- detalha no Quadro 1.
DAS, 2015e). No documento Data for development: an ac-
No relatrio A world that counts: mobizing tion plan to finance the data revolution for sustainable
the data revolution for sustainable development (IN- development (OPEN DATA WATCH, 2015, p. 8, tra-
DEPENDENT EXPERT ADVISORY GROUP, 2015), a duo nossa), elaborado pela ONU e pelo Open Data
ONU convoca os pases signatrios da Agenda 2030, Watch, afirma que
as empresas e a sociedade civil a coordenarem esfor-
os com a finalidade de melhorar a disponibilidade, os ODS vo depender mais de observaes geoespaciais
a qualidade, a atualizao e a desagregao das in- e terrestres que os ODM. Imagens de satlite esto cada
formaes, objetivando apoiar a implementao em vez mais disponveis gratuitamente em uma resoluo
todos os nveis. moderada e com custos progressivamente menores
De acordo com o documento Assessing gaps in para fontes de alta resoluo. Dados de satlite tm o
indicator availability and coverage (CASSIDY, 2014), potencial para serem utilizados no monitoramento de
um grande desafio a ser superado refere-se baixa co- mais de 23 indicadores dos ODS em potencial, desde
bertura geral dos indicadores propostos. Quase um ter- a medio da qualidade do ar global at cobertura de
o dos indicadores carece de dados em mais da metade florestas e cultivos, impactos de desastres e recursos
dos pases (SHUANG et al., 2013) e, em mdia, apenas hdricos. Novas imagens via satlite so um exemplo de
46% dos dados foram coletados, o que apresenta um tecnologias emergentes que oferecem oportunidades
desafio internacional no que se refere gerao de dados significativas para uma plataforma de monitoramento
estatsticos (NAES UNIDAS, 2014e). de recursos hdricos.

Quadro 1:
Diferenas entre os Objetivos de Desenvolvimento do Milnio (ODM)
e os Objetivos de Desenvolvimento Sustentvel (ODS)

ODM ODS
Durao 2000-2015 2016-2030
Pontos de controles intermedirios (SACHS, 2012) Ausentes Presentes
Complexidade do monitoramento (INTERNATIONAL ORGANISATION
8 objetivos, 20 metas 17 objetivos, 196 metas
OF SUPREME AUDIT INSTITUTIONS, 2015)
Abrangncia geogrfica (SACHS, 2012) Pases em desenvolvimento Todos os pases signatrios
Negociadas entre os governos; desenvolvimento de sistema de
Formas de monitoramento No definidas previamente
monitoramento
Papel da tecnologia (SACHS, 2012) Secundrio Fundamental
Foco (NAES UNIDAS, 2014e) Alvio da pobreza Desenvolvimento sustentvel em sentido amplo

Fonte: Elaborao dos autores

Setembro/Dezembro 2016 46
Artigos

No h dvidas de que a coleta de dados compre- Das fontes primrias dos indicadores propostos
ende um grande desafio. Por isso, deve-se fazer uso de por esse relatrio (SDSN, 2015), 11% esto relaciona-
novas tecnologias e mtodos disponveis, como aqueles das aos dados sobre meio ambiente, estes que incluem
fornecidos por meio das tecnologias de informao geo- dados geoespaciais. O Quadro 2 mostra as fontes de
grfica e big data (NAES UNIDAS, 2015a). Como h dados primrios para esses indicadores.
cada vez mais dados disponveis, o estudo de mtodos Outro componente da ecologia dos dados remete
com utilizao de bases de dados vem ganhando maior aos princpios-chave para selecionar indicadores de mo-
destaque (FREITAS; DACORSO, 2014). nitoramento global, propostos pelo relatrio Follow-up
Dada a amplitude e complexidade da Agenda and Review of the SDGs: fulfilling our commitments
2030, so necessrios diversos tipos de dados com di- (NAES UNIDAS, 2015b). De acordo com esses prin-
ferentes nveis de cobertura (SUSTAINABLE DEVE- cpios, os indicadores precisam ser: limitados em n-
LOPMENT SOLUTIONS NETWORK, 2015). Nesse mero e em concordncia global (para indicadores de
contexto, cada tipo de dado d sustentao e tambm monitoramento global); simples (por exemplo, indicado-
sustenta os outros tipos. res de uma varivel com implicaes polticas diretas);
Para o monitoramento dos ODS so necess- apresentados com alta frequncia, o que permite moni-
rios a composio e o fomento de um ecossistema de toramento regular, preferencialmente anual; baseados
dados. Por esse motivo, a ONU especifica no relat- em consenso, alinhado com padres internacionais e
rio Data for development: A Needs Assessment for informaes baseadas em sistemas; construdos a partir
SDG Monitoring and Statistical Capacity Develop- de fontes de dados bem estabelecidas; mais desagrega-
ment (SDSN, 2015) a tipologia dos dados, esclarece dos quanto possvel; universais; focados no resultado;
quais so as fontes de dados primrios e estabelece os baseados em dados cientficos; e ter uma boa aproxi-
princpios-chave para a seleo de indicadores de mo- mao (proxy) para questes e condies mais amplas.
nitoramento robustos. Parte integrante da ecologia de dados so as ferra-
A tipologia dos dados refere-se a dados de censo, mentas e metodologias para coleta, anlise e comunica-
registros civis e estatsticas sobre nascimento, pesquisas o dos dados. Essas ferramentas e metodologias esto
domiciliares, pesquisas agrcolas, dados administrativos, intrinsicamente relacionadas aos campos geoespaciais.
estatsticas econmicas e dados sobre meio ambiente, Trata-se da fotogrametria, da cartografia, dos sistemas
incluindo dados geoespaciais. Estes ltimos so cruciais de informao geogrfica (SIG) e anlises geoespaciais,
para determinar indicadores ambientais dos ODS, assim de sensoriamento remoto e da inteligncia geoespacial.
como para anlise desagregada dos indicadores socioe- Desses campos, h alguns que so especialmente
conmicos destes (SDSN, 2015). relevantes para o monitoramento dos ODS pelas EFS:
a cartografia2; os sistemas de informao geogrfica3 e
o sensoriamento remoto4. Esses campos fazem parte
Quadro 2:
do que caracterizamos neste trabalho como geotecno-
Fontes de dados primrios para os indicadores dos ODS logias, ou seja: o conjunto de tecnologias para coleta,
processamento, anlise e disponibilizao de informa-
es georreferenciadas (SOUZA, 2016, p. 40).
Fonte de dados primrios No evento Unleashing the power of Where to
Dados administrativos 33%
make the world a better place: How geographic infor-
Pesquisas domiciliares 26%
mation contributes to achieving the SDGs (NAES
Dados internacionais 13%
Dados sobre meio ambiente (pesquisas agrcolas ou dados
UNIDAS, 2015f), Lawrence Friedl, representando a Na-
11% tional Aeronautics and Space Administration (NASA),
geoespaciais)
Registro civil e estatsticas de nascimento 8% afirmou que os ODS chegaram em um momento de
TBD 6% convergncia privilegiada para aproveitar as potencia-
Pesquisas sobre fora de trabalho 2% lidades dos dados espaciais. A informao geogrfica
Outros dados econmicos 2% um elemento essencial no complexo contexto da im-
Censos Transversal
plementao e monitoramento da Agenda 2030 (Id.,
TOTAL 100%
2015a), sendo mencionada na meta nmero 18 do ODS
Fonte: Sustainable Development Solutions Network (2015, traduo e grifo nosso)
nmero 17, que busca o fortalecimento dos meios de
implementao e a revitalizao da parceria global para

47 Revista do TCU 137


Geotecnologias e o monitoramento dos Objetivos de Desenvolvimento Sustentvel pelas Entidades de Fiscalizao Superior // Artigos

o desenvolvimento sustentvel como uma das fontes Tambm afirma que a depender das especificidades de
relevantes de dados. A meta 17.18 objetiva incenti- cada EFS, pode-se incluir especialistas no processo, seja
var o desenvolvimento de capacidades em pases em por contratao ou por consultoria.
desenvolvimento at 2020, visando ampliar significati- J Auditing forests: guidance for Supreme Audit
vamente a disponibilidade de dados confiveis, atuali- Institutions ((INTERNATIONAL ORGANISATION
zados e de alta qualidade, desagregados, por exemplo, OF SUPREME AUDIT INSTITUTIONS, 2010), elabo-
por localizao geogrfica (Id., 2015c). rado pelo Grupo de Trabalho em Auditoria Ambiental
Ao analisar os indicadores nacionais propostos (WGEA) da Intosai, descreve como as EFS podem utili-
pelo Sistema das Naes Unidas no Brasil (PROGRAMA zar a tecnologia do Sistema de Informao Geogrfica
DAS NAES UNIDAS PARA O DESENVOLVIMEN- (SIG). Ao tratar de aspectos metodolgicos, o documen-
TO, 2015), percebe-se que uma quantidade significativa to afirma que tecnologias computacionais podem ser
desses necessita de desagregao geogrfica. A maio- excepcionalmente teis em auditorias. Dois exemplos
ria dos indicadores propostos utiliza alguma forma de dessas tecnologias so o GPS e o SIG ((INTERNATIO-
desagregao geogrfica e, de acordo com o relatrio NAL ORGANISATION OF SUPREME AUDIT INS-
Acompanhando a Agenda 2030 para o desenvolvimen- TITUTIONS, 2010, p. 9). Dados geogrficos podem
to sustentvel, a desagregao de dados que a nova ser utilizados para diversas finalidades e em diferentes
agenda apresenta um desafio a ser superado. fases da auditoria. O SIG pode ser utilizado na fase de
planejamento e o GPS na fase de execuo como uma
3. REFERNCIAS TCNICAS DA ferramenta de suporte. Dados geogrficos podem ser
INTOSAI QUE ABORDAM O empregados em diversas finalidades, como em dife-
TEMA GEOTECNOLOGIAS rentes fases do planejamento, aplicativos baseados em
redes virias, aplicativos baseados em recursos naturais,
O documento ISSAI 5130 Sustainable develo- anlises panormicas, gesto de instalaes, entre outros
pment: the role of Supreme Audit Institutions (INTER- (INTERNATIONAL ORGANISATION OF SUPREME
NATIONAL ORGANISATION OF SUPREME AUDIT AUDIT INSTITUTIONS, 2010).
INSTITUTIONS, 2004), ao tratar sobre as novas atribui- De acordo com o documento Environmental
es derivadas dos ODS, reconhece que as instituies data: resources and options for Supreme Audit Insti-
precisaro questionar se as metodologias existentes para tutions (INTERNATIONAL ORGANISATION OF
realizar as auditorias so adequadas para esse contexto. SUPREME AUDIT INSTITUTIONS, 2013a) tanto os

Setembro/Dezembro 2016 48
Artigos

gestores pblicos auditados quanto as EFS se benefi- dente aumento em complexidade para se avaliar a base
ciaro do uso de SIG. O referido documento descreve de dados. Por isso, as EFS que consideram a possibilida-
dados geoespaciais separadamente, em uma seo es- de de utilizar esse tipo de dado necessitam investir em
pecfica, por considerar que estes trazem consideraes acesso s ferramentas e tambm no desenvolvimento
nicas para as EFS. Devido a restries oramentrias das competncias tcnicas necessrias.
dos governos, os gestores pblicos sentem-se pressio- No relatrio The 7th survey on environmental
nados a demonstrar resultados, o que os leva a utilizar auditing (Id., 2012), a WGEA apresenta o resultado da
em maior escala dados ambientais para demonstrar que pesquisa respondida por mais de 112 EFS. A pesquisa
seus programas atingiram os objetivos estabelecidos. solicitou que as EFS descrevessem metodologias inova-
Esse tipo de mudana pode afetar como o desempenho doras de trabalho que vinham aplicando em auditorias
medido e como gestores pblicos e EFS avaliam esses ambientais. A tecnologia geoespacial foi o item mais
programas (INTERNATIONAL ORGANISATION OF votado5.
SUPREME AUDIT INSTITUTIONS, 2013a). A ISSAI 5540 (INTERNATIONAL ORGANISA-
O referido documento afirma que fontes de da- TION OF SUPREME AUDIT INSTITUTIONS, 2013b),
dos espaciais podem ser especialmente teis para EFS que aborda questes relacionadas utilizao de dados
quando estas esto realizando a verificao de questes geoespaciais em auditorias de gesto de desastres am-
ambientais que tenham aspecto geogrfico explcito, bientais, afirma que os SIG e o sensoriamento remoto
como reas de proteo ambiental ou identificao de podem fornecer valor agregado a todos os estgios da
reas poludas. Dados geoespaciais so tambm teis auditoria, como demonstra o Quadro 36. Segundo o do-
para selecionar amostras de diferentes locais, para iden- cumento, os SIG podem auxiliar na anlise extensiva e
tificar reas de alto risco e padres nos dados, o que no complexa de dados de diversas formas: apresentar os
seria possvel se estes no tivessem seu componente dados espacialmente, consultar dados por localizao
espacial. As EFS tambm podem utilizar os dados es- espacial, analisar localizaes espaciais e armazenar e vi-
paciais como forma de apresentar seus resultados, tor- sualizar dados em camadas, entre outras. Os SIG permi-
nando-os mais tangveis. tem que os usurios produzam mapas de alta qualidade
Por fim, no Environmental Data: Resources and em qualquer escala, armazenem grande quantidade de
Options for Supreme Audit Institutions (INTOSAI, informaes geogrficas, visualizem dados complexos e
2013a) afirma-se que a utilizao de dados atrelados a produzam novos dados com base nos dados existentes.
informaes geogrficas torna as bases de dados mais A ISSAI 5540 prope um checklist sobre a utiliza-
complexas pela necessidade de se registrar o qu e onde o de informaes geoespaciais em auditorias, repro-
est acontecendo, utilizando-se, para isso, de coorde- duzido integralmente no Quadro 4.
nadas geogrficas. Dessa forma, gera-se uma grande A referida ISSAI tambm afirma que a utilizao
demanda de controle de qualidade, alm do correspon- de informaes geoespaciais e do SIG no setor pblico

Quadro 3:
Aplicao das geotecnologias s diversas fases da auditoria de acordo com a ISSAI 5540

ETAPA DA AUDITORIA APLICAO DAS GEOTECNOLOGIAS


Os SIG tornam possvel a anlise de vrios dados ou camadas de dados em um contexto geogrfico. O sensoriamento remoto pode ser utilizado
Avaliao de riscos relevantes
para verificar informaes em bases de dados com informaes de campo
Planejando a auditoria Os SIG e o sensoriamento remoto podem auxiliar nesse ponto ao decidir sobre o foco da auditoria
A equipe pode utilizar dispositivos de GPS e mapas baseados em satlite para conectar dados de auditoria em campo a dados geogrficos. Dessa
Conduzindo a auditoria
forma, possvel analisar os dados de campo imediatamente aps carreg-los e combin-los com mapas
Com os SIG possvel analisar diferentes camadas de informao geogrfica, anlise a partir da qual o desempenho pode ser medido. Ainda, a
Anlise dos resultados da auditoria
visualizao de resultados com os SIG permite a viso sobre as diferenas geogrficas no desempenho das organizaes pblicas
Utilizando os SIG e o sensoriamento remoto, resultados de auditorias podem ser mapeados e apresentados para apoiar as principais concluses e
Comunicao dos resultados recomendaes das auditorias e facilitar a comunicao dos resultados. A visualizao dos resultados das auditorias em mapas permite a transmis-
so de uma mensagem clara e forte em comparao quela somente escrita

Fonte: Adaptado de International Organisation of Supreme Audit Institutions (2013b, traduo nossa)

49 Revista do TCU 137


Geotecnologias e o monitoramento dos Objetivos de Desenvolvimento Sustentvel pelas Entidades de Fiscalizao Superior // Artigos

Quadro 4:
Checklist sobre utilizao de dados geoespaciais em auditorias

Checklist: utilizao de dados geoespaciais em auditorias


Que dados geoespaciais so necessrios para responder s perguntas da auditoria?
Qual a acurcia dos dados geoespaciais requerida?
Qual o prazo exigido para os dados geoespaciais?
Que dados geoespaciais esto disponveis?
De que fontes os dados geoespaciais podem derivar e quo confiveis elas so?
Qual a qualidade dos dados geoespaciais disponveis?
Quais os custos dos dados geoespaciais disponveis?
Se os dados geoespaciais requeridos no estiverem disponveis, eles podem ser coletados como parte do processo e do oramento da auditoria?
Os auditores envolvidos possuem o conhecimento necessrio para coletar e analisar os dados geoespaciais requeridos ou necessrio incluir um especialista externo?

Fonte: International Organisation of Supreme Audit Institutions (2013b, traduo nossa)

tem crescido por diversas razes. Uma das principais sistematizao subsidie futuros estudos a serem desen-
a extenso e a complexidade da informao, que volvidos no mbito das EFS sobre o tema.
deve ser considerada e analisada enquanto tomam-
-se decises. Muitas decises requerem informaes NOTAS
geoespaciais e os SIG apoiam a anlise desse tipo de
informao. Dentro do contexto de polticas pblicas, 1 Por exemplo, a aplicao de imagens de satlite ou o uso do
as informaes geoespaciais cumprem diversas fun- sensoriamento remoto para aes de controle.
es, como a definio de objetivos, a formulao de
medidas, o monitoramento e a avaliao. Alm disso, 2 Disciplina que se encarrega da concepo, produo, disseminao
so muitas as reas da poltica pblica em que se po- e estudo de mapas tanto como objetos tangveis quanto digitais.
dem utilizar informaes geoespaciais. Exemplos7 de-
las so gesto de recursos naturais, proteo ao meio 3 Qualquer sistema que capture, armazene, administre e visualize
ambiente, economia, educao, segurana e sade ( dados associados localizao.
INTERNATIONAL ORGANISATION OF SUPREME
AUDIT INSTITUTIONS, 2013b). 4 Cincia de mensurar a propriedade de algum objeto ou fenmeno
por um sensor que no tem contato fsico com o objeto/fenmeno
4. CONSIDERAES FINAIS estudado.

Dentre as iniciativas propostas pela ONU para 5 Com a mesma quantidade de votos, compartilhando o primeiro
que os ODS superem os desafios encontrados pelos lugar como metodologia inovadora por essa pesquisa, ficou o uso
Objetivos de Desenvolvimento do Milnio, est a uti- de expertise externa.
lizao de dados geoespaciais (NAES UNIDAS,
2015e). Alm disso, nas Normas Internacionais das IS- 6 Cabe ressaltar as similaridades entre as etapas da auditoria e
SAI (INTERNATIONAL ORGANISATION OF SUPRE- algumas das funes descritas no DACUM Research Chart for
ME AUDIT INSTITUTIONS, 2004) so reconhecidas Geospatial Analyst (capture data, manage data, analyse data,
a importncia da capacitao de seus servidores para produce deriverables). Disponvel em: <http://bit.ly/2gqLhvT>.
atender s novas demandas. Acesso em: 12 jul. 2016.
Este artigo se props a fazer a reviso da litera-
tura sobre as referncias tcnicas das Naes Unidas e 7 O artigo denominado O uso de geotecnologias como uma
da Intosai que pudessem contribuir com a utilizao de nova ferramenta para o controle externo (2015), publicado na
geotecnologias para o monitoramento dos ODS pelas edio n 133 da Revista do TCU, exemplifica oito aplicaes de
Entidades de Fiscalizao Superior. Espera-se que essa geotecnologias das quais o controle pblico pode se beneciar.

Setembro/Dezembro 2016 50
Artigos

Anexo 1:
Exemplos de suporte das geotecnologias aos Objetivos de Desenvolvimento Sustentvel (Naes Unidas, 2015)

ODS INDICADOR DESCRIO DO INDICADOR DESAGREGAO FONTE1


Perdas por desastres naturais, Mede perdas humanas e financeiras em reas Este indicador pode ser
Acabar com a pobreza em todas as relacionados ou no a mudanas rurais e urbanas devidas a desastres naturais, desagregado espacialmen- Fontes no
1 6
suas formas, em todos os lugares climticas (em dlares ou vidas desagregadas em eventos relacionados ou no a te (incluindo a segregao geoespaciais
perdidas) mudanas climticas entre urbano e rural)
Acompanha as lacunas de desenvolvimento das Dados geoespaciais,
Acabar com a fome, alcanar a segu- Adequado para desagre-
principais culturas, ou seja, rendimento atual incluindo senso-
2 rana alimentar e melhoria da nutrio 13 Lacuna no rendimento de culturas gao espacial, de escalas
comparado quele que seria possvel em per- riamento remoto e
e promover a agricultura sustentvel locais a globais
feitas condies satlite
Acesso a estradas transitveis durante todo o
ano questo crtica para processos de desen-
Acesso durante todo ano a estra- Dados geoespaciais,
Construir infraestrutura resiliente, volvimento rural, incluindo acesso a insumos,
das transitveis Este indicador pode ser de- incluindo senso-
9 promover a industrializao inclusiva e 58 mercados, educao e servios de sade. Este
(% acesso a estradas dentro de sagregado espacialmente riamento remoto e
sustentvel e fomentar a inovao indicador acompanha a parte da populao que
um raio de [x] km de distncia) satlite
vive dentro de um raio de [x] km de estradas
que so transitveis durante todo o ano
Dados geoespaciais,
Tornar as cidades e os assentamentos A mdia de poluio do ar urbano
Acompanhamento da mdia de poluio do incluindo senso-
11 humanos inclusivos, seguros, resilien- 69 de material particulado (MP10 Por cidade e estado
ar urbano riamento remoto e
tes e sustentveis e MP2.5)
satlite
Este indicador pode ser
Medida dos aerossis totais (por exemplo: Dados geoespaciais,
reportado com um alto
Assegurar padres de produo e de partculas de fumaa, poeira, sal do mar) incluindo
12 75 Profundidade tica de aerossol grau de desagregao
consumo sustentveis distribudos em uma coluna de ar da superfcie sensoriamento
espacial (incluindo cidades
da Terra at a parte superior da atmosfera remoto e satlite
e no nvel de bairro)
Acompanha a variao lquida de rea florestal Dados geoespaciais,
Proteger, recuperar e promover o uso Variao anual em rea florestal ee a expanso da agricultura em ecossistemas Este indicador pode ser de- incluindo senso-
sustentvel dos ecossistemas terres- 83 rea cultivada (indicador alteradonaturais, assim como a perda de terrenos pro- sagregado espacialmente riamento remoto e
tres, gerir de forma sustentvel as dos ODM) dutivos para o crescimento de reas urbanas, satlite
15
florestas, combater a desertificao, indstrias, estradas e outros usos Dados geoespaciais,
deter e reverter a degradao da terra Componentes de degradao do solo incluem Desagregao geogrfica incluindo senso-
Variao anual em rea degradada
e deter a perda de biodiversidade 85 a salinizao, a eroso, a perda de nutrientes do por sub-regio riamento remoto e
ou desertificada (% ou ha)
solo e o assoreamento satlite

Fonte: Adaptado de Naes Unidas (2015c, traduo nossa)

REFERNCIAS INDEPENDENT EXPERT ADVISORY GROUP. A world that


counts: mobilising the data revolution for sustainable
CMARA, G. Representao computacional de dados development UN report. 2015. 30 p. Disponvel em: <http://
geogrficos. In: CASANOVA, M. et al. Bancos de Dados bit.ly/1DcbDol>. Acesso em: 8 jun. 2016.
geogrficos. Curitiba: MundoGEO, 2005. p. 1-44.
INTERNATIONAL ORGANISATION OF SUPREME AUDIT
CASSIDY, M. Assessing gaps in indicator availability and INSTITUTIONS. Auditing forests: guidance for supreme
coverage. 2014. Disponvel em: <http://bit.ly/2glULel>. audit institutions. 2010. 71 p. Disponvel em: <http://bit.
Acesso em: 8 jul. 2016. ly/2fJOrK5>. Acesso em: 12 jul. 2016.

FREITAS, R. K. V. de; DACORSO, A. L. R. Inovao aberta na ______. Environmental data: resources and options for
gesto pblica: anlise do plano de ao brasileiro para a supreme audit institutions. 2013a. 64 p. Disponvel em:
Open Government Partnership. Revista de Administrao <http://bit.ly/2gEOStn>. Acesso em: 12 jul. 2016.
Pblica, Rio de Janeiro, v. 48, n. 4, p. 869-888, 2014.

51 Revista do TCU 137


Geotecnologias e o monitoramento dos Objetivos de Desenvolvimento Sustentvel pelas Entidades de Fiscalizao Superior // Artigos

______. ISSAI 5130. Exposure draft. Sustainable on ______. 23e Symposium ONU/INTOSAI. 2015d. 8 p.
development: the role of supreme audit institutions. 2004. Disponvel em: <http://bit.ly/2fJRstI>. Acesso em: 5 jun. 2016.
53 p. Disponvel em: <http://bit.ly/2fcy2Br>. Acesso em: 12
jul. 2016. ______. The millennium development goals report 2015.
2015e. 73 p. Disponvel em: <http://bit.ly/1Rg5uUm>. Acesso
______. ISSAI 5540. Use of geospatial information in auditing em: 5 jul. 2016.
disaster management and disaster-related aid. 2013b. 36 p.
Disponvel em: <http://bit.ly/2glYicn>. Acesso em: 14 jul. ______. Unleashing the power of Where: how geographic
2016. information contributes to achieving the SDGs. 2015f. 24 p.
Disponvel em: <http://bit.ly/2fcsLtH>. Acesso em: 9 jul. 2016.
______. The 7th survey on environmental auditing. 2012.
77 p. Disponvel em: <http://bit.ly/2fvUVOT>. Acesso em: ______. NoTheme I: Sustainable Development Goals.
12 jul. 2016. How INTOSAI can contribute to the UN post 2015 agenda
including good governance in order to strengthen the fight
______. The role of sais and means of implementation for against corruption? Abu Dhabi: Incosai, 2016.
sustainable development (lessons learned from MDGs). 2015.
Disponvel em: <http://bit.ly/2gkLcc0>. Acesso em: 9 jul. OPEN DATA WATCH. Data for development: an action plan
2016. to finance the data revolution for sustainable development.
2015. 81 p. Disponvel em: <http://bit.ly/2fvQaVD>. Acesso
NAES UNIDAS. Ambassador statement: unleash ing the em: 9 jul. 2016.
power of Where to make the world a better place: How
geographic information contributes to achieving the SDGs. P R O G R A M A D A S N A E S U N I D A S PA R A O
2015a. 3 p. Disponvel em: <http://bit.ly/2fJOZ2z>. Acesso DESENVOLVIMENTO. Acompanhando a agenda 2030
em: 5 jul. 2016. para o desenvolvimento sustentvel: subsdios iniciais do
Sistema das Naes Unidas no Brasil sobre a identificao
______. Assessing gaps in indicator availability and coverage. de indicadores nacionais referentes aos Objetivos de
2014. 9 p. Disponvel em: <http://bit.ly/2glULel> Acesso em: Desenvolvimento Sustentvel. Braslia: PNUD, 2015. 250 p.
5 jun. 2016.
SACHS, J. D. From millennium development goals to
______. Follow-up and Review of the SDGs: fulfilling our sustainable development goals. The Lancet, London, v. 379,
commitments. 2015b. 39 p. Disponvel em: <http://bit. p. 2206-2211, 2012.
ly/2fvQkMQ>. Acesso em: 9 jul. 2016.
SUSTAINABLE DEVELOPMENT SOLUTIONS NETWORK. Data
______. Indicators and a monitoring framework for the for development: a needs assessment for SDG monitoring
sustainable development goals: launching a data revolution and statistical capacity development. 2015. 81 p. Disponvel
for the SDGs. 2015c. 225 p. Disponvel em: <http://bit. em: <http://bit.ly/1zeUVcf>. Acesso em: 9 jul. 2016.
ly/1DMsAfp>. Acesso em: 9 jul. 2016.
SHUANG, C. et al. Towards a Post-2015 Framework that
______. Resolution A/66/209. Promoting the efficiency, Counts: Development National Statistical Capacity. 2013.
accountability, effectiveness and transparency of public Disponvel em: <http://bit.ly/2g8V35c>. Acesso em: 9 jul.
administration by strengthening supreme audit institutions. 2016.
2011. Disponvel em: <http://bit.ly/2fctLy9> Acesso em: 5
jul. 2016. SOUZA, A. D. Modelo de controle para obras de esgotamento
sanitrio utilizando sistema de informaes geogrficas.
______. Resolution A/69/228. Promoting and fostering the 2016. Tese (Doutorado em Engenharia Civil) Universidade
efficiency, accountability, effectiveness and transparency Federal de Pernambuco, Recife, 2016.
of public administration by strengthening supreme
audit institutions, 2014a. 3 p. Disponvel em: <http://bit.
ly/2gETHmm>. Acesso em: 5 jun. 2016.

Setembro/Dezembro 2016 52
Artigos

InfoSAS: um sistema de
minerao de dados para
controle da produo do SUS

Osvaldo Carvalho  Wagner Meira Jr. 


doutor de Estado em PhD pela Universidade de
Cincia da Computao pela Rochester e professor titular
Universidade Pierre et Marie de Cincia da Computao
Curie e professor associado na Universidade Federal de
da UFMG. Trabalhou com Minas Gerais. Suas reas de
algoritmos distribudos, e interesse so minerao
hoje leciona Programao de de dados, sistemas
Computadores e desenvolve paralelos e distribudos
sistemas de informao. e suas aplicaes.

Marcos Prates  Renato M. Assuno 


bacharel pela UFMG (2006) PhD em Estatstica pela
em Matemtica Computacional, University of Washington/
mestre pela UFMG (2008) em EUA e professor titular do
Estatstica e PhD em Estatstica Departamento de Cincia da
pela University of Connecticut, Computao da UFMG, alm de
EUA (2011). Desenvolve mtodos especialista em desenvolvimento
estatsticos e algoritmos para de algoritmos e mtodos para
anlise de estatstica espacial a anlise de dados estatsticos,
e aprendizado de mquina. especialmente aqueles com
georreferenciamento.

Raquel Minardi  Jos Nagib Cotrim rabe 


bacharel em Cincia da Computao, PhD em Cincia da
doutora pela UFMG e ps-doutora Computao pela University
pelo Comissariat lnergie Atomique of California, Los Angeles
et aux nergies Alternatives (CEA). (UCLA), alm de professor
Desenvolve modelos e algoritmos da Universidade Federal
em visualizao de dados e em de Minas Gerais e chefe
biologia computacional. Publicou do Departamento de
mais de 20 artigos em peridicos Cincia da Computao.
internacionais e em conferncias
nacionais e internacionais.

53 Revista do TCU 137


InfoSAS: Um sistema de minerao de dados para controle da produo do SUS // Artigos

retranca imagem

ctrl + Shift + click para liberar


retranca

RESUMO que no Brasil a situao seja diferente. Neste documento


apresentamos o InfoSAS, um sistema de minerao e vi-
Este trabalho apresenta o InfoSAS, um sistema sualizao de dados do SUS que, como diversos outros
de deteco de anomalias estatsticas nos registros da (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996), iden-
produo do SUS. O InfoSAS encontra taxas de atendi- tifica padres e modelos variados nos dados, podendo
mentos por habitante muito superiores mdia nacio- ser de grande valia para a gesto do SUS e, em particular,
nal, ou valores de internao bem acima dos praticados para a identificao de anomalias estatsticas que podem
pela maioria dos estabelecimentos para um mesmo ser indcios de irregularidades. O foco deste artigo a
procedimento. Os resultados encontrados indicam que sua utilizao para fins de auditoria.
centenas de milhes de reais gastos pelo SUS so desti- O InfoSAS encontra em profuso fatos que me-
nados a atendimentos considerados anmalos por cri- recem a ateno de gestores, como taxas de atendimen-
trios conservadores. Anomalias estatsticas podem ser tos por habitante muito superiores mdia nacional,
provocadas por fraudes, mas tambm por mutires de como se pode ver na Figura 2; ou valores de internao
sade, epidemias, ou m distribuio do atendimento. bem acima dos praticados pela maioria dos estabeleci-
Em qualquer caso, anomalias graves devem ser investi- mentos, como mostrado na Figura 4. Temos elementos,
gadas ou explicadas. expostos na Seo 5, para acreditar que sua utilizao
na priorizao de auditorias pode gerar retornos para o
Palavras-chave: SUS, Sistema nico de Sade, SUS da ordem de R$400 milhes por ano. No exa-
Deteco de anomalias, Minerao de dados, Taxa de gero estimar em bilhes de reais o valor que pode ser
atendimentos por habitante, Valor mdio de interna- recuperado com auditorias a serem feitas sobre a pro-
es, Distribuio log-normal, Priorizao de auditorias. duo de um perodo de 8 anos (de 2009 a 2016), assim
como com a inibio de comportamentos anmalos na
1. INTRODUO produo futura.

A grande dimenso do setor de sade e o enorme 2. DISCREPNCIAS ESTATSTICAS


volume de recursos envolvidos fazem dele um alvo atra-
ente para fraudes em todo o mundo. Nos Estados Uni- Os atendimentos prestados pelo SUS (denomina-
dos, por exemplo, estima-se que mais de 270 bilhes de dos conjuntamente de produo do SUS) so registrados
dlares sejam perdidos anualmente com fraudes (THE por diversos instrumentos e esses registros so armaze-
ECONOMIST, 2014). No temos motivos para acreditar nados nas bases SIA1 e SIH2. O SUS tambm mantm

Setembro/Dezembro 2016 54
Artigos

a base CNES3, um cadastro de estabelecimentos. O sis- A Figura 1 mostra um exemplo de grfico pre-
tema InfoSAS examina essas bases do SUS e tambm sente em uma folha de fatos. Nele vemos que, para o
dados populacionais fornecidos pelo IBGE, e produz o alvo Tratamento de doenas do aparelho da viso, o
que chamamos de folhas de fatos. atendimento total de Curitiba, no perodo de setembro
As bases de dados referidas so volumosas e es- de 2013 a agosto de 2014, seguiu de perto a expectati-
sas folhas de fatos do foco ao seu exame. Elas relacio- va segundo a mdia brasileira, que este atendimento
nam um alvo de minerao, um perodo de anlise e um superior mdia do Paran, e que o prestador con-
estabelecimento prestador, mostrando grficos e tabelas tribuiu com menos da metade desse atendimento. Es-
obtidas pelo exame das bases de dados. Um alvo de mi- sas so informaes compatveis com uma situao de
nerao um subconjunto da produo do SUS, defini- normalidade.
do por um ou mais procedimentos da Tabela do SUS4, e Mas nem sempre assim. Alguns fatos chamam
algumas vezes tambm pela faixa etria dos pacientes. ateno do profissional de controle. Na Figura 2, diver-
importante observar que fatos presentes nas folhas sos municpios esto com uma taxa de atendimentos
podem tambm ser verificados de forma independente por habitante muito acima da brasileira e da estadu-
consultando outras fontes de informao oferecidas pelo al, e o estabelecimento em questo praticamente o
SUS, como o TabWin5. nico a atender esses municpios. Este um exemplo
claro do que consideramos anomalias ou discrepncias
estatsticas.
Discrepncias estatsticas devem ser considera-
Figura 1:
das com cuidado, como ilustra o exemplo mostrado na
Anlise da participao de um estabelecimento no atendimento de
Curitiba para o alvo Tratamento de doenas do aparelho da viso Figura 3. Cada um dos seis grficos mostrados se refere
a um municpio e todos a um nico prestador. Pode-se
notar que somente o grfico no canto superior esquerdo
(que corresponde ao municpio sede do estabelecimen-
to) no apresenta picos estranhos, com valores muito
acima dos esperados pelas taxas brasileiras e da UF onde
se localizam os municpios. Um indcio de fraude? No.
Quando se nota que o alvo Mamografia e que o
prestador uma unidade mvel, a anomalia estatstica
se explica: o prestador um veculo equipado com um

Figura 2:
Anlise da taxa de atendimento por habitante de 6 municpios atendidos por um
estabelecimento para o alvo Tratamento de doenas do aparelho da viso

55 Revista do TCU 137


InfoSAS: Um sistema de minerao de dados para controle da produo do SUS // Artigos

Figura 3:
Discrepncias estatsticas explicveis pelas caractersticas do alvo, Mamografia bilateral
para rastreamento, e do prestador, uma Unidade Mvel de Sade da Mulher

mamgrafo que realiza mutires em pequenas cidades, Na Figura 4 temos outros exemplos de discre-
provocando em suas visitas os picos de atendimentos. pncias estatsticas, agora com estabelecimentos pra-
De forma geral, importante observar que uma ticando preos mdios de internao muito superiores
anomalia estatstica pode sim ser um indcio de frau- aos praticados no restante do Brasil para dois alvos de
de, mas tambm pode resultar de processos corretos, minerao. Novamente, preciso que o gestor exami-
como no exemplo acima, ou de informao incorreta, ne com cuidado cada caso de discrepncia estatstica,
ou de epidemias. E tambm possvel que municpios pois possvel que o estabelecimento tenha um perfil
com taxas de atendimento altas sejam, na verdade, os de pacientes com complicaes acima da mdia, ou
poucos bem atendidos no pas. Portanto, a anlise de que utilize prticas que podem elevar o custo da in-
uma folha de fatos deve ser feita com o mximo de dis- ternao, mas que tambm, digamos, diminuam sua
cernimento e por um profissional de sade pblica que taxa de bitos.
conhea o contexto local.

Figura 4:
Anlise do valor cobrado por um estabelecimento para internaes dos alvos Artroplastia total primria do quadril no cimentada/
hbrida, esquerda, e por outro estabelecimento para Cirurgia cardiovascular Cirurgia cardiovascular marcapasso, direita

Setembro/Dezembro 2016 56
Artigos

3. DETECO AUTOMTICA DE
DISCREPNCIAS ESTATSTICAS

Encontrar folhas de fatos de interesse para o con-


trole em uma Secretaria de Sade um fator de conven-
cimento para a deciso de apurao. Entretanto, buscar
ao acaso discrepncias relevantes como procurar uma
agulha em um palheiro. Temos mais de 5000 alvos, apro-
ximadamente 6000 prestadores e, considerando apenas
perodos de 12 meses, em 3 anos de produo, seriam 36
janelas de tempo possveis. Um clculo simples mostra
que temos, literalmente, bilhes de folhas de fatos que
podem ser extradas das bases de dados examinadas.
O InfoSAS mostra seu valor nesse momento,
pois utiliza diversos algoritmos que procuram capturar
discrepncias, produzindo escores que permitem orde-
nao e priorizao das folhas de fatos. Para a seleo,
o InfoSAS tambm permite ao usurio concentrar-se
em reas definidas por filtros geogrficos, por perodo
de anlise e por alvos, pois um profissional de controle
e avaliao tem, muitas vezes, sua ateno dirigida para
setores especficos da sade, como cardiologia ou orto-
pedia e, claro, maior interesse em sua regio de atuao.
O InfoSAS analisa as sries temporais de valor
mdio mensal por procedimento e de produo men- temporal de produo realizada por todos os estabele-
sal em cada alvo desejado. Tais sries so calculadas cimentos nos residentes de um municpio analisada.
por estabelecimento e por municpio de residncia dos Caso este municpio tenha uma produo acima do li-
pacientes. Vrios algoritmos de deteco de anomalias miar, o algoritmo atribui um escore de discrepncia a
so utilizados e cada um deles calcula um escore. Estes ele. Em seguida, o escore atribudo aos estabelecimen-
escores so posteriormente combinados. Por falta de tos de forma proporcional participao de cada um no
espao para descrever em detalhes todos os escores, va- atendimento a esse municpio.
mos apresentar a seguir a definio de dois deles. Uma O escore do estabelecimento obtido soman-
descrio mais detalhada de outro algoritmo pode ser do-se os escores que ele obteve em cada municpio
encontrada em (CARVALHO et al., 2015). de atuao. Mais formalmente, o escore de produ-
Um algoritmo tem como objetivo detectar oscila- o do municpio calculado como uma soma acu-
es abruptas na produo de um prestador. Para isso, a mulada nos ltimos 12 meses, escoreli=ji=i-11diflj , onde
produo do estabelecimento comparada com sua pr- difli=max{0,tBayesli-limiari} e limiari=k*taxaBrasili. O valor
pria srie histrica de produo (ou de valor mdio). Se de taxaBrasili a taxa de produo mensal brasileira por
houver uma mudana brusca na srie, o algoritmo atribui 100 mil habitantes no ms i, tBayesli a taxa bayesiana
um escore de discrepncia ao estabelecimento. Mais espe- emprica por 100 mil habitantes no ms i para o muni-
cificamente, em cada ms i e para cada estabelecimento l, cpio l, e k uma constante previamente definida. Em
ns calculamos escoreli=(tli+1)/(medianali+1), onde tli a di- nossos estudos, temos usado k=3. A taxa bayesiana em-
menso de interesse (que pode ser o valor ou o nmero de prica (ASSUNO et al., 1998; MARSHALL, 1991)
atendimentos) para o l-simo estabelecimento no i-simo uma tcnica estatstica para calcular taxas e razes que
ms, medianali a mediana dos ltimos m meses para a no afetada pela flutuao de pequenas populaes.
quantidade de interesse do l-simo estabelecimento no i-
-simo ms. Tipicamente, tomamos m=12 ou m=6 meses. 4. FUNCIONAMENTO DO INFOSAS
Outro algoritmo procura detectar discrepncias
em taxas de atendimento por habitante. Tomando como A Figura 5 mostra o fluxo de dados do InfoSAS.
base a produo brasileira por 100 mil habitantes, a srie Mensalmente, dados das bases SIA, SIH e CNES, e tam-

57 Revista do TCU 137


InfoSAS: Um sistema de minerao de dados para controle da produo do SUS // Artigos

bm dados populacionais do IBGE alimentam o servidor nizao dos processos de seleo de itens para auditoria
de minerao de dados, que guiado por uma tabela de e controle. Alm da necessidade de manuteno do sis-
alvos de minerao e que executa algoritmos para detec- tema, constante atualizao, correo e calibragem fina
o de discrepncias estatsticas. Esta fase de minerao dos algoritmos j utilizados, existem muitas linhas para
produz o que ns chamamos de cubo de fatos minerados. desenvolvimentos futuros. Vislumbramos uma nova
Este cubo explorado pelo usurio do InfoSAS, utilizan- interface com visualizao mais flexvel e interativa
do uma ferramenta de BI. O usurio seleciona um modelo dos resultados; uma caracterizao estatstica de alvos
de relatrio e especifica parmetros para filtros por con- com identificao de vazios assistenciais; a utilizao
junto de alvos, perodo de anlise e recortes geogrficos. da populao SUS nos clculos estatsticos; o clculo
Um relatrio produzido de acordo com o modelo esco- de limites inferiores e superiores para a atribuio de
lhido e com os filtros determinados, contendo escores de produo anmala de um municpio a seus prestado-
discrepncia calculados pelos algoritmos de minerao. res; a escolha adaptativa de recortes geogrficos com o
Do relatrio, o usurio extrai para anlises mais aprofun- dimensionamento adequado frequncia de ocorrncia
dadas folhas de fatos que lhe chamam a ateno. de cada alvo; e a utilizao de paralelismo no processa-
mento da minerao e da visualizao.
5. CONCLUSO E TRABALHOS FUTUROS Alm desses, queremos destacar dois desenvol-
vimentos que, a nosso ver, so os mais importantes a
No momento atual (outubro de 2016), o InfoSAS serem feitos. O primeiro destes seria viabilizado pela
est instalado e em funcionamento no DATASUS. Um realizao de auditorias, talvez guiadas por alertas do
curso a distncia para capacitao de gestores quanto InfoSAS, classificando atendimentos um a um como
ao uso do InfoSAS est em preparao, devendo ser fi- fraudulentos ou regulares. Essa rotulao abre a possi-
nalizado at novembro de 2016, com a primeira oferta bilidade de utilizao de algoritmos de aprendizado su-
prevista ainda para este ano. O sistema InfoSAS j foi pervisionado, permitindo a emisso de alertas de forma
apresentado em diversos eventos nacionais (DRAC SAS, mais precisa e elaborada.
2015) e, em todos eles, seus resultados foram julgados O outro consiste em uma anlise consolidada de
muito interessantes por especialistas em sade pblica. anomalias em taxas de atendimentos por habitante. O
Os resultados j obtidos pelo projeto InfoSAS so InfoSAS, em sua verso atual utiliza diversos algoritmos
importantes e representam um passo frente na moder- que procuram capturar anomalias estatsticas. Temos

Figura 5:
Etapas da anlise de dados pelo sistema InfoSAS

Setembro/Dezembro 2016 58
Artigos

tambm uma estrutura de alvos de minerao onde um situarem direita do ponto que divide a rea sob a cur-
alvo pode incluir outros alvos. Com isso, conseguimos va em uma parte normal, com 99% de probabilidade;
muitos achados, mas no temos como classificar esta- e em uma parte anormal, com 1% de probabilidade,
belecimentos pelo conjunto de alvos nem obter estima- o que nos parece um critrio bastante prudente. Para o
tivas globais de valor para produo anmala. exemplo da Figura 7, taxas acima de 3,2 atendimentos
Para produzir um novo relatrio superando es- por 1.000 habitantes/ms so consideradas anormais.
tes problemas, ns decidimos ter como alvos somente Suponhamos que para o alvo em questo, um municpio
conjuntos de procedimentos em uma mesma forma de de 100.000 habitantes tenha recebido 400 atendimentos
organizao da Tabela do SUS, o que faz com que a inter- em um dado ms. Pela taxa limite de 3,2 atendimen-
seo entre dois alvos quaisquer seja vazia, e utilizar um tos/1.000 habitantes, a populao desse municpio de-
nico algoritmo com uma metodologia estatstica para veria ter recebido, no mximo, 320 atendimentos. Ns
estimativa de excessos em taxas de atendimentos por consideramos, ento, que o municpio teve 80 aten-
habitante. Isso torna possvel a obteno de estimativas dimentos anmalos, cujo valor distribudo entre os
globais (em todos os alvos) de produo anmala para prestadores do municpio, mantendo as propores do
cada prestador, o que permite a priorizao da apurao atendimento de cada prestador.
de fatos pelos gestores do SUS. Os resultados da aplicao desta anlise produ-
A metodologia que pretendemos utilizar, e que j o registrada no SUS em 2013 so fortes. De um total
aplicamos a dados de 2013, tem como ponto de partida de R$19.912.491.904,00, foram considerados anormais
a constatao de que a distribuio das taxas de atendi- atendimentos com valor somado de R$413.920.365,56,
mento por habitante observadas nos municpios segue correspondendo a 2,08% do total. O excesso em alvos
uma distribuio log-normal, como ilustrado na Figura registrados no SIHSUS foi de R$350.354.969,25, e no
6. Isso abre a possibilidade de definio para qualquer SIA de R$63.565.396,30.
alvo e para qualquer municpio de um ponto de corte Outro resultado deste estudo que pode ser uti-
para o que deve ser considerado como normal ou anor- lizado para priorizao de auditorias uma anlise da
mal em uma taxa de atendimentos por habitante. distribuio entre prestadores dos atendimentos consi-
Ns arbitramos que taxas de atendimento por derados anmalos. Em todo o Brasil, apenas 5 prestado-
habitante devem ser consideradas anormais quando se res concentram quase 9% do valor total das anomalias;

Figura 6:
Densidade da probabilidade de taxas de atendimento por habitante: log-normal terica vs. dados observados

59 Revista do TCU 137


InfoSAS: Um sistema de minerao de dados para controle da produo do SUS // Artigos

Figura 7:
Definio da taxa-limite de atendimentos por habitante no ponto de corte de 1% da distribuio log-normal

mais de 50% desse total est concentrado em 100 pres- REFERNCIAS


tadores. Um nico prestador teve quase 10 milhes de
reais em atendimentos considerados como anmalos ASSUNO, R. M. et al. Maps of epidemiological rates:
em 2013. a Bayesian approach. Cadernos de Sade Pblica, Rio de
Janeiro, v. 14, n. 4, p. 713723, out./dez. 1998.
6. AGRADECIMENTOS
CARVALHO, L. F. M. et al. A simple and effective method
Em primeiro lugar temos que agradecer ao De- for anomaly detection in healthcare. In: 4TH WORKSHOP
partamento de Regulao, Avaliao e Controle da Se- ON DATA MINING FOR MEDICINE AND HEALTHCARE, IN
cretaria de Ateno Sade do Ministrio da Sade, que CONJUNCTION WITH THE 15TH SIAM INTERNATIONAL
solicitou e financiou todo o projeto. CONFERENCE ON DATA MINING, 2015, Vancouver, maio 2015.
O InfoSAS foi construdo por uma equipe gran- Disponvel em http://homepages.dcc.ufmg.br/~carlos/
de e multidisciplinar. Maria Helena Brando foi a con- papers/sdm/dmmh2015.pdf. Acesso em 29 nov. 2016.
dutora do projeto por parte do DRAC. Ester Dias,
Marcelo Campos, Snia Gesteira e Suzana Rattes, DRAC SAS. Ministrio da Sade. Ciclo de Oficinas do DRAC
da SMSA-BH, Luciana Morais, da Funed, e Mnica Controle de Avaliao. Braslia, DF, 1 set. 2015. Disponvel
Castro, da Unimed-BH, foram nossos consultores sa- em: <https://www.youtube.com/watch?v=vIaR_Q7T-Us>.
nitaristas. Fabiana Peixoto e Letcia Neto foram as Acesso em: 4 jul. 2016.
gerentes, e Tomas Schweizer foi o lder tcnico. Edr
Moreira, Carlos Teixeira, Douglas Azevedo, Larissa FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data
Santos, Luiz Fernando Carvalho, Luiz Gustavo Silva, mining to knowledge discovery in databases. AI magazine,
Maurcio Nascimento Jr., Milton Ferreira, Jos Carlos California, v. 17, n. 3, p. 37-54, 1996.
Serufo Jr., Pablo Fonseca, Renan Xavier e Raquel Fer-
reira, bolsistas de ps-graduao, participaram deci- MARSHALL, R. J. Mapping disease and mortality rates using
sivamente na pesquisa, construo e implementao empirical Bayes estimators. Applied Statistics, Auckland, v.
de diversos algoritmos. Felipe Caetano, caro Braga, 40, n. 2, p. 283294, 1991.
Geraldo Franciscani, Joo Paulo Pesce, Joo Victor Br-
bara, Raphael de Faria e Wicriton Silva cuidaram de THE ECONOMIST. The $272 billion swindle. Londres, 31 maio
desenvolvimento, testes, visualizao e bancos de da- 2014. Disponvel em http://www.economist.com/news/
dos. A toda essa equipe, verdadeira responsvel pela united-states/21603078-why-thieves-love-americas-health-
construo do sistema, vo os nossos mais sinceros care-system-272-billion-swindle. Acesso em: 29 nov. 2016.
agradecimentos.

Setembro/Dezembro 2016 60
Artigos

Aplicativos de auditoria: uma


ferramenta eficaz para assegurao
de compras governamentais1

Qiao Li  RESUMO
candidata a doutorado
na Rutgers, a Universidade Recentemente, governos de muitos pases adotaram
Estadual de Nova Jersey, Estados iniciativas de dados abertos com o objetivo de tornar suas
Unidos. O trabalho de pesquisa operaes mais transparentes para os cidados. Com os da-
desenvolvido por Li inclui dos abertos, qualquer um que tenha interesse em monitora-
auditoria analtica, planejamento mento de gastos do governo pode aplicar tecnologias para
e gesto de risco em auditoria, realizar anlises sobre dados de compras pblicas governa-
sistemas para suporte em mentais. Este trabalho prope 29 aplicativos de auditoria
auditoria e aprendizado de que podem ajudar diversas partes interessadas na anlise de
mquina (machine learning). dados governamentais abertos. Esses aplicativos podem aju-
dar a investigar dados de aquisio sob diferentes perspecti-
vas, tais como autenticao das qualificaes do contratante,
Jun Dai  deteco de precificao duvidosa etc. Esse artigo usa dados
professora assistente na de contratos de compras do Governo Federal brasileiro para
Southwestern University of Finance ilustrar a funcionalidade desses aplicativos. No entanto, os
and Economics, na China, e aplicativos tambm podem ser utilizados por outras naes
candidata a doutorado na Rutgers, para analisar seus dados governamentais abertos.
a Universidade Estadual de Nova
Jersey, Estados Unidos. O trabalho Palavras-chave: Aplicativos de Auditoria, Anlise
de pesquisa desenvolvido por Dai de Dados, Compras Pblicas Governamentais.
inclui auditoria analtica, automao
em auditoria, aplicativos para 1. INTRODUO
auditoria e blockchain.
De acordo com a Organizao Mundial do Comr-
cio (OMC), contratos pblicos governamentais respondem,
em mdia, por 10% a 15% do Produto Interno Bruto (PIB)
de uma economia (OMC 2015a). Os governos so grandes
compradores de bens e servios e isso os tornam vtimas
frequentes de fraudes em contratos pblicos (Robbins Geller

61 Revista do TCU 137


Aplicativos de auditoria: uma ferramenta eficaz para assegurao de compras governamentais // Artigos

retranca imagem

ctrl + Shift + click para liberar


retranca

Rudman & Dowd LLP 2016). Devido ao complicado pro- 2. ANTECEDENTES


cesso de licitao e contratao, aos vrios tipos de contra-
tos, confidencialidade de informaes e descentralizao 2.1 DADOS ABERTOS DO GOVERNO E
do armazenamento de dados muito difcil para as partes ASSUNTOS RELACIONADOS
interessadas organizarem, analisarem e monitorarem os
contratos dos governos federais e locais. Nos ltimos anos, No termo dados abertos, a palavra "aberto" indica que
governos de muitos pases, tais como Estados Unidos, Ca- os dados esto disponveis gratuitamente para todos utiliza-
nad e Brasil, comearam iniciativas de dados abertos, com rem e redistriburem (Auer et al., 2007). Tais dados so reuni-
o objetivo de tornar as informaes sobre as operaes do dos e mantidos pelos governos e podem ser acessados pelos
governo imediatamente disponveis, teis e transparentes cidados atravs de stios online. Muitos pases tm criado
para os seus cidados (Data.gov 2016). bancos de dados abertos, para tornar os dados disponveis
Embora fontes de dados abertos disponibilizem ao pblico. Por exemplo, o Brasil publicou um sistema de
informaes governamentais para o pblico, poucos es- informao de aquisio federal chamado "SIASG". O Brasil
tudos ou metodologias avaliam como partes interessadas tambm fornece Interfaces de Programao de Aplicativos
podem coletar e analisar dados. Dessa forma, este traba- (APIs) para que os cidados possam baixar dados sobre con-
lho visa desenvolver e propor aplicativos de auditoria que tratos federais associados a fornecedores, mercadorias etc.
podem servir como instrumentos eficazes para o moni- Apesar de ter sido divulgada uma grande variedade de da-
toramento das despesas pblicas e identificar possveis dos do governo, esse estudo concentra-se apenas em dados
anomalias nos contratos. Aplicativos de auditoria so abertos que se relacionam com contratos pblicos. Alguns
procedimentos formalizados de auditoria realizados por exemplos de pases que criaram sites e bancos de dados que
meio de scripts de computador, que tem se popularizado possuem dados de compras governamentais bem-sucedidos
recentemente. Esse trabalho prope uma estrutura que incluem os EUA, China, Austrlia, Canad, Brasil e Reino
fornece orientao para a concepo de aplicativos de au- Unido. Por exemplo, o governo britnico publicou seus da-
ditoria eficazes que examinam contratos governamentais. dos de contratos em 2010. Utilizando essa informao, um
Para ilustrar essa afirmativa, projetamos 29 aplicativos oficial britnico encontrou registros duplicados de compras
de auditoria que identificam potenciais contratos de alto em vrios departamentos do governo que custaram mais de
risco. Oito desses aplicativos foram desenvolvidos para 4 milhes de libras (6 milhes de dlares). Em outro exem-
demonstrar a sua utilidade e benefcios ao utilizar dados plo, oficiais do governo de So Francisco tornaram pblicos
contratuais do Governo Federal brasileiro. os dados de transporte em 2012. Eles estimam que o nmero

Setembro/Dezembro 2016 62
Artigos

de atendimentos de consultas telefnicas abaixou e com isso que esses grupos comecem a trabalhar com dados abertos.
economizaram mais 1 milho de dlares (The Economist 2015). Primeiro, alm de dados abertos do governo, eles podem
No entanto, existem alguns problemas com dados abertos tambm precisar coletar dados teis provenientes de outras
que ainda impedem seu sucesso. Em primeiro lugar, a quali- fontes. Essas fontes podem incluir mdias sociais, notcias, re-
dade dos dados no boa o suficiente. Embora os governos latrios governamentais e relatrios de analistas. difcil para
de muitos pases sejam obrigados a divulgar dados relaciona- as partes interessadas coletar essas informaes e integr-las
dos, o nvel de divulgao varia. Todos os campos de dados com dados abertos governamentais. Um desafio ainda maior
teis so fornecidos? Os detalhes dos dados so adequados? existe em analisar a grande quantidade de dados disponveis.
Existe alguma informao faltando? Estas questes podem Poucas ferramentas analticas foram especificamente concebi-
alterar a eficcia da anlise de dados abertos. Em segundo das para a variedade de usurios que querem investigar dados
lugar, alguns dados abertos no so preparados em um for- governamentais (O'Leary 2015). Embora existam muitos pro-
mato legvel por mquina, como o formato PDF digitalizado gramas de software de anlise de dados gerais sobre o mer-
(que so na verdade fotos). Isto torna a coleta e anlise de cado, a complexidade inerente dessas ferramentas analticas
dados mais difcil. Em terceiro lugar, a quantidade de dados pode impedir a compreenso e a utilizao pelos usurios
enorme. Isto significa que procurar portais de dados aber- do software. Este problema evidente, especialmente, para
tos e extrair informaes relevantes e teis so muitas vezes usurios com conhecimento limitado de auditoria e anlise
uma tarefa rdua. Outro problema que poucos indivduos de dados. Portanto, desenvolver ferramentas de anlise de
possuem habilidades para analisar e interpretar dados e, em dados eficientes e eficazes uma questo crtica.
seguida, aproveitar essas interpretaes ou concluses. Por
fim, dados no publicados podem ser muito valiosos, mas 2.3 APLICATIVOS NA REA DE AUDITORIA
so dificilmente acessveis devido questo da privacidade
de dados (The Economist 2015). Aplicativos de auditoria so rotinas analticas forma-
lizadas, executadas por uma ferramenta informatizada (Dai,
2.2 USURIOS INTERESSADOS EM DADOS ABERTOS Krahel e Vasarhelyi 2014). Cada aplicativo de auditoria geral-
mente executa um teste nico de auditoria analtica, exigindo
As partes interessadas em explorar dados abertos, geralmente poucas interaes do usurio. Os usurios s pre-
identificar anomalias, descobrir irregularidades e detectar cisam carregar dados em aplicativos de auditoria para obter
fraudes incluem, mas esto no limitados a: cidados, im- resultados sem muitas operaes complicadas. Auditores po-
prensa, empresas concorrentes e concorrentes polticos. H dem at mesmo criar aplicativos de auditoria personalizadas
pelo menos dois desafios que devem ser abordados antes que realizam tarefas especiais de auditoria. A popularidade

63 Revista do TCU 137


Aplicativos de auditoria: uma ferramenta eficaz para assegurao de compras governamentais // Artigos

de aplicativos de auditoria tem crescido recentemente. Isto , necessria orientao para projetar aplicativos
em parte, devido a desenvolvedores de software e provedo- eficientes e eficazes. Propomos uma estrutura que forne-
res de servios de auditoria, que tm feito esforos para criar ce orientao para design de aplicativos para auditorias de
aplicativos de auditoria2. Alguns aplicativos no mercado, no compras governamentais. A estrutura (mostrada na Figu-
entanto, so desenvolvidos especialmente para os cidados ra 1) contm quatro dimenses: tipo de anomalia, tipo de
que pretendem analisar dados abertos do governo. dados, plataforma de software e tcnica.
Aplicativos de auditoria podem estar entre as fer- A primeira dimenso o tipo de anomalia. Anomalias
ramentas favoritas para analisar dados abertos por vrias podem ser classificadas em trs tipos: financeiro, operacional
razes. Uma delas que aplicativos, em geral, podem e relacionadas fraude. Anomalias financeiras referem-se s
ser operadas facilmente com treinamento mnimo. Isso anomalias de dados que podem afetar demonstraes ou rela-
permite que vrias partes interessadas, de vrias reas de trios financeiros governamentais. Estes podem incluir a falta
escolaridade, possam analisar os dados com facilidade. O de dados ou valores incorretos / desatualizados. Anomalias
baixo custo das aplicativos outra razo pela qual elas so operacionais focam na ineficincia das operaes e ativida-
uma opo atraente. A maioria dos usurios so cidados des governamentais. Estas incluem a compra de produtos de
ou empresas concorrentes e no auditores profissionais. luxo para escritrio (como uma cadeira de massagem extre-
Como resultado, difcil para estes comprarem um sof- mamente cara), bens obviamente desnecessrios (como joias)
tware profissional de auditoria caro. Aplicativos de audito- ou bens necessrios com preos significativamente maiores
ria so substitutas com bom custo benefcio que permitem do que a taxa de mercado. Anomalias relacionadas com frau-
aos usurios executar uma grande variedade de testes de de apresentam padres de dados incomuns que podem ser
auditoria com base em anlise. Personalizao outra resultados de fraudes. Por exemplo, se todos os licitantes ofe-
vantagem importante dos aplicativos, porque permite es- recem um preo uniforme e se recusarem a negociar durante
tender aplicativos para cumprir tarefas especficas do usu- o processo de licitao do governo.
rio. Os usurios podem criar aplicativos personalizados A segunda dimenso a plataforma de software.
usando Kits de Desenvolvimento de Software profissional. Esta ser usada para desenvolver e operar aplicativos de
auditoria. Geralmente, existem dois tipos de platafor-
3. UMA ESTRUTURA PARA mas: Software de anlise de dados de auditoria (ADAS)3
PROJETAR APLICATIVOS e Software de anlise de dados generalizados (GDAS)4. O

Figura 1:
Estrutura para projetar
um aplicativo
Tipo de anomalia

Anomalias inanceiras

Anomalias operacionais

Anomalias relacionadas a fraudes


Tcnica Data

Anlise Estatsticas Estatsticas Machine Dados Outros dados Dados no


bsica descritivas learning abertos pblicos publicados

Software analtico de dados gerais

Software analtico de auditoria

Plataforma de Software

Setembro/Dezembro 2016 64
Artigos

ADAS contm funes de auditoria pr-programadas, o ser usadas para localizar processos arriscados de operaes
que torna a criao de aplicativos com base em funes governamentais e identificar potenciais contratos ou transa-
mais fcil. O GDAS geralmente tem a capacidade de ma- es fraudulentas. Os aplicativos devem ser desenvolvidos
nipulao de dados de alto volume, como vrios dados para facilitar as anlises de uma grande variedade de dados.
abertos. O GDAS tambm contm uma grande varieda- A ltima dimenso est relacionada tcnica. Tc-
de de estatsticas e modelos de aprendizagem de mqui- nicas analticas bsicas podem ser usadas para identificar
na, tornando-o til para desenvolvimento de aplicativos. padres incomuns. Tais tcnicas incluem sumarizao,
A desvantagem desse tipo de software que ele requer consulta e correspondncia de dados. Estatsticas descriti-
formao tcnica ou treinamento dos usurios para com- vas podem fornecer uma viso global de dados. Estatsticas
preender os modelos sofisticados. Como cada plataforma (por exemplo, regresso e sries temporais) e aprendizado
de software tem suas caractersticas especiais, os desen- de mquina (por exemplo, agrupamento e classificao)
volvedores podem criar vrias verses de aplicativos que so tcnicas avanadas que podem descobrir efetivamente
permite aos usurios execut-los em diferentes softwares. padres escondidos dentro de dados complexos. Os de-
A terceira dimenso est relacionada ao tipo de da- senvolvedores devem tirar proveito dessas tcnicas para
dos. Recentemente, muitos estudos tm discutido a utiliza- criar aplicativos eficazes e eficientes
o de "big data" para fins de garantia (Vasarhelyi, Kogan e
Tuttle 2015; Cao, Chychyla e Stewart 2015; Yoon, Hoog- 4. PROJETANDO APLICATIVOS PARA
duin e Zhang 2015; Alles 2015). medida que mais pa- AUDITORIA DE DESPESAS PBLICAS
ses e organizaes comeam a abrir seus dados, tais dados
abertos se movero rapidamente para big data (O'Leary Propomos 29 aplicativos que podem ajudar a identificar
2015). Alm disso, outros dados pblicos, tais como artigos potenciais anomalias nas despesas do governo. Essas anomalias
de notcias, mdia social e dados coletados de mquinas ou incluem contratos suspeitos ou a utilizao de fornecedores
vrios sensores podem ser coletados. Todos esses dados no qualificados. A Tabela 1 mostra os aplicativos propostos.
podem ser combinados e usados para identificar anomalias Os trs primeiros aplicativos fornecem uma ve-
ou respaldar investigaes (Vasarhelyi et al. 2015). Ademais, rificao preliminar sobre a confiabilidade e integridade
certas informaes inditas, tais como polticas de opera- dos dados de contratos governamentais. Eles tambm
es internas de certas unidades governamentais, tambm demonstram quaisquer padres de dados especiais. Pa-
podem fornecer esclarecimento quanto a identificao de dres de dados anormais, tais como valores ausentes e
atividades anormais governamentais. Quando integrado flutuao anormal, podem indicar riscos no processo de
com dados pblicos, essas informaes inditas podem contratao. Esses aplicativos fornecem garantia prelimi-

65 Revista do TCU 137


Aplicativos de auditoria: uma ferramenta eficaz para assegurao de compras governamentais // Artigos

Tabela 1:
Lista de aplicativos propostos

No Objetivo do Aplicativo Indicador de Anomalia Dados Tcnicas


Aplicativos para dados incompletos / Verificao de integridade e Constatao de padres de dados
1 Verifica valores de contratos anormais Nmeros incomuns como 0, 0.01, 0.05 Dados de contrato Consulta
2 Verifica a integralidade e integridade de dados Ausncia de fornecedores/licitao/datas/etc. Dados de contrato Consulta
Encontra padres de dados especiais (usando painel
3 Flutuao anormal de dados, nmeros extremamente grandes ou pequenos, etc. Dados de contrato Estatstica descritiva
de instrumentos)
Aplicativos para Fornecedores Suspeitos
Dados de con-
4 Verifica a informao do fornecedor Fornecedores no existem no arquivo principal trato, dados de Comparao de dados
fornecedores
Fornecedores, ou sua empresa matriz/subsidirias, esto na lista de empresas Dados de contrato,
5 Verifica a qualificao do fornecedor Comparao de dados
suspensas Empresas suspensas
Informao de mem-
6 Verifica relacionamentos Membros da famlia do fornecedor trabalham no governo bros da famlia de Consulta
fornecedores
Fornecedores tm uma alta proporo de contratos que no passaram por proces-
7 Verifica licitao dispensvel Dados de contrato Consulta
sos normais de licitao
Algumas empresas sempre ganham ou todos os fornecedores ganham um nme- Dados de contrato,
8 Verifica ganhadores anormais de licitaes Sumarizao
ro igual de licitaes dados de licitaes
Informao geogrfi-
9 Verifica a distribuio regional de fornecedores Fornecedores em uma rea especfica ganham a maioria dos contratos Visualizao
ca de fornecedores
10 Verifica a combinao anormal do licitante Os mesmos licitantes sempre ou nunca concorrem entre si Dados de licitaes Sumarizao
Aplicativos para Preos e Valor Inicial de Contrato Anormais
11 Verifica valores anormais de contratos Valores iniciais de contratos no esto em conformidade com a lei de Benford Valores de contrato Lei de Benford
Fornecedores propem preos elevados em licitaes governamentais do que o Comparao de dados,
12 Compara preos de contratos Dados de preos
preo de mercado consulta
13 Identifica compras divididas Contratos com mesmo fornecedor, datas e bens e/ou servios Dados de contratos Deteco duplicada
14 Prev e identifica preos vencedores anormais Preos vencedores so maiores que preos previstos Dados de contratos Regresso
Grande diferena entre o preo de oferta do vencedor e dos outros preos
15 Identifica diferenas de preos anormais Informao de preos Consulta
propostos
Todos os preos dos fornecedores parecem uniformes. Fornecedores recusam
16 Verifica o desvio-padro do valor de licitao Preos de licitao Desvio-padro
negociar preos.
17 Verifica alteraes de contrato Os valores iniciais dos contratos mudaram muito Dados de contrato Comparao de dados
Aplicativos para Procedimento e Modalidade Anormais de Licitao
18 Verificar a vigncia do licitante Muitos poucos fornecedores vigentes Processo de licitao Consulta
Processo de lici-
Consulta, comparao
19 Detecta desistncia de licitantes Licitantes qualificados retiram propostas vlidas inexplicavelmente tao, dados de
de dados
fornecedores
20 Detecta propostas duplicadas Empresas apresentam licitaes com itens individuais idnticos e montantes fixos Processo de licitao Deteco duplicada
Licitante com endereos, fac-smile, nmeros de telefones ou outros dados demo- Informao demo-
21 Detecta licitantes duplicados Deteco duplicada
grficos duplicados grfica de licitantes
Preos de licitao
22 Verifica flutuao anormal do preo de oferta Competidores anunciam o aumento do preo ao mesmo tempo, e no mesmo valor durante o processo Deteco duplicada
licitatrio
Produtos Anormais /Implementao de Servios
23 Verifica produtos de luxo Governo compra produtos de luxo Dados de contrato Minerao de texto
24 Verifica itens obviamente desnecessrios Governo compra muitos itens desnecessrios como vale-presentes Dados de contrato Minerao de texto
25 Verifica custos excessivos Custos excedem em muito as estimativas Dados de contrato Consulta
26 Verifica horas trabalhadas Funcionrios cobram mais horas do que o horrio normal de trabalho Faturas Consulta
27 Verifica faturamentos duplicados Faturas duplicadas para o mesmo produto ou servio Faturamento Deteco duplicada
28 Verifica local de entrega anormal O local de entrega no um escritrio, fbrica ou local de obra Endereo de entrega Visualizao
29 Verifica informaes geogrficas de fatura Empregados so faturados em vrios locais de obras distantes, no mesmo dia Faturas Visualizao

Setembro/Dezembro 2016 66
Artigos

nar de nvel de dados identificando contratos com valores anormais ou desnecessrios, bem como taxas de servios
ausentes ou anormais. Os aplicativos de 4 a 10, auxiliam na no prestados. Isso inclui gastos excessivos em produtos
identificao de fornecedores suspeitos. Visto que forne- para escritrio ou utilizao indevida de fundos pblicos.
cedores podem estar envolvidos em muitos tipos de frau-
des, necessrio desenvolver aplicativos para monitorar 5. ILUSTRAO DE APLICATIVOS
o comportamento dos fornecedores durante os processos UTILIZANDO CONTRATOS FEDERAIS
de licitao e contratao. Esses aplicativos so, portanto, DE COMPRAS BRASILEIRAS
projetadas para identificar fraudes tais como suborno, es-
quemas de comisses e manipulao de preos de licitao. Para demonstrar a utilidade dos aplicativos de audi-
Os aplicativos de 11 a 17 foram projetadas para identificar toria na auditoria de contratos de governo, coletamos dados
padres de preos incomuns. Tendo em vista que contra- de contratos e fornecedores do Sistema Integrado de Admi-
tos arriscados so normalmente associados com preos nistrao de Servios Gerais (SIASG) e do Cadastro Nacional
anormais, esses aplicativos podem chamar a ateno para de Empresas Inidneas e Suspensas (CEIS), de 1989 a 2014. O
contratos de alto risco. Os aplicativos de 18 a 22 podem arquivo de contrato contm, principalmente, informaes so-
ser utilizadas para analisar e monitorar o procedimento bre entidades governamentais, fornecedores de bens e servios,
complexo de licitao. Estes aplicativos podem identificar mtodos de licitaes, datas de incio / trmino e valores iniciais
rapidamente comportamentos suspeitos de licitao, que de contratos. O arquivo de fornecedores registra previamente
pode se caracterizar quando poucos licitantes vlidos par- as empresas para participar de processos de licitao. Os dados
ticipam de uma licitao ou quando uma h uma retirada nesse arquivo incluem o CNPJ das empresas e suas informa-
inexplicvel de uma licitao do processo. Os aplicativos es demogrficas. O sistema CEIS grava o CNPJ das empre-
de 23 a 29 ajudam a identificar as compras de produtos sas que esto proibidas de vender produtos ou servios para o

Figura 2:
Aplicativos de Auditoria para Anlise Descritivas (Adaptado de Dai; Li, 2016)

67 Revista do TCU 137


Aplicativos de auditoria: uma ferramenta eficaz para assegurao de compras governamentais // Artigos

governo federal brasileiro e inclui a data de incio e trmino de linhas mostra as alteraes em valores totais de contrato ao
suas sanes. Com base nos dados, desenvolvemos oito apli- longo do tempo. Verifica-se um pico em 1999, ano em que
cativos para executar a anlise descritiva, verificao de dados a primeira crise financeira atingiu o Brasil6. Isto indica uma
incompletos e de integridade e identificao de anomalias. preocupao de risco potencial nas despesas pblicas.

5.1 PAINEL DE ANLISE DESCRITIVA 5.2 DADOS INCOMPLETOS E VERIFICAO


DE INTEGRIDADE DE DADOS
Um aplicativo de auditoria5 desenvolvido para rea-
lizar anlises descritivas dos dados de contrato de compras Os campos importantes nos dados de contrato so
do governo. A Figura 2 utiliza um painel para mostrar os os fornecedores, a modalidade de licitao e as datas de
resultados. O painel esquerdo lista os campos importantes incio e trmino dos contratos. Portanto, a integridade
no conjunto de dados. O painel direito usa diversos grficos desses dados crticos deve ser verificada antes de realizar
para mostrar a anlise descritiva dos valores de contratos, anlises avanadas. Trs aplicativos7 foram criados para ve-
oferecendo tipos de licitaes e entidades governamentais. rificar a integridade de cada um dos trs campos e denun-
O grfico mostra que 9,6% e 19% das compras foram as- ciar contratos que tenham valores faltando. Os resultados
sociadas com a modalidade de licitao 06 (dispensa de mostram que 35.516 contratos (de 470.683) no tm infor-
licitao) ou 07 (inexigibilidade de licitao), respectiva- maes de fornecedores, 16.167 contratos no informam a
mente. A tabela resume o valor inicial de contratos em cada modalidade de licitao e as datas de incio e trmino no
modalidade de licitao. De acordo com a tabela, contratos so mostradas em 1.000 contratos. A ausncia de valores
com modalidade de licitao 07 e 06 compem o terceiro nos campos crticos pode ser resultado de erros simples
e quarto lugar, respectivamente, em termos de valores de na alimentao de dados ou de atividades fraudulentas,
contrato inicial. As informaes do grfico e da tabela indi- como suborno ou esquemas de comisso. Mais testes de
cam que os contratos com modalidade de licitao 07 ou 06 auditoria devem ser realizados para identificar e verificar
poderiam apresentar um alto risco de fraude. Isto decorre o motivo pelo qual tais valores esto ausentes.
porque esquemas de comisses e suborno esto suscetveis
de ocorrer quando bens ou servios so comprados sem pro- 5.3 IDENTIFICAO DE ANOMALIAS
cessos licitatrios regulares. O histograma mostra os gastos
de cada entidade de governo entre os anos de 1989 e 2014. Contratos de alto risco geralmente esto associados
As trs entidades mais importantes do governo so atpicas com padres de dados especiais que raramente ocorrem em
pois gastaram muito mais do que o restante. O grfico de situaes normais. Por exemplo, um fornecedor pode ganhar

Setembro/Dezembro 2016 68
Artigos

uma possvel fraude envolvendo os contratos. Os resulta-


dos do aplicativo sugerem que h mais contratos que tm
valores iniciais comeando com "60", "79" e "80" do que o
esperado. Isso indica possveis riscos nesses contratos. A po-
ltica interna do governo brasileiro permite procedimentos
de licitao simplificados se o valor do contrato for inferior
a R$ 80.000. Compras diretas sem licitao so permitidas
caso o valor no seja maior que R$ 8.000. Os resultados da
anlise da lei de Benford indicaram que empresas e agn-
cias governamentais podem ter conspirado para reduzir o
valor inicial do contrato para adaptar-se a esses limites que
simplificam os processos de compras.
Analisar fornecedores um aspecto importante na
auditoria de contratos governamentais: auditores devem
prestar mais ateno em compras feitas por empresas que
possuem registro no CEIS. Isso ocorre porque o uso de tais
fornecedores de alto risco pode resultar na quebra de con-
trato ou no fornecimento de produtos ou servios de baixa
qualidade. Contratos assinados com subsidirias ou em-
presas matrizes das empresas suspensas tambm precisam
uma licitao ao oferecer um preo extremamente baixo no ser analisadas cuidadosamente. Essas empresas podem
incio, s para aumentar esse preo mais tarde. Outro exem- subcontratar o servio das empresas sob sano. Um apli-
plo seria uma empresa continuar vendendo bens e servios cativo de auditoria10 foi desenvolvido para identificar os
aps ter sido penalizada por um descumprimento de uma contratos cujos fornecedores ou subsidirias/matrizes esto
obrigao. Padres anormais em contratos geralmente indi- registrados no CEIS. Os resultados mostram que um total
cam comportamento fraudulento por parte dos fornecedores, de 25.100 contratos foram assinados com empresas ou suas
entidades governamentais ou ambos. Tais fraudes podem subsidirias/matrizes que esto, ou fizeram parte, da lista
causar enormes prejuzos aos governos. Esses contratos de- do CEIS. Por exemplo, o fornecedor "33.000.118" e as suas
vem ser identificados e sinalizados para que uma investigao subsidirias assinaram 1.717 contratos com entidades do
complementar seja conduzida. Nesse trabalho, quatro apli- governo brasileiro de 1989 a 2014. Isto ocorreu mesmo com
cativos foram desenvolvidos para identificar contratos que o fornecedor tendo sido temporariamente suspenso por
possuam valores iniciais ou fornecedores anormais. uma agncia governamental especfica de 15 de dezembro
Um aplicativo de auditoria8 foi desenvolvida para de 2014 a 14 de dezembro de 2016. Pode ocorrer que este
identificar contratos com valores iniciais extremamente fornecedor preste servios a outras agncias do governo; no
baixos (menos que R$ 0,1). Os resultados demonstram entanto, os contratos assinados pela empresa e suas subsi-
um total de 9.334 contratos que possuem valores iniciais dirias devem ser cuidadosamente analisados.
inferiores a R$ 0,1. Dentre esses contratos, 8.678 tm R$ O sistema SIASG possui um arquivo de fornecedores
0,00 como valor inicial, 625 possuem valores superiores independentes que registra empresas pr cadastradas em
a R$ 0,00, mas menores que R$ 0,05 e o valor inicial dos processos de licitao. Apesar desse registro no ser obri-
31 contratos restantes esto na faixa de R$ 0,05 a R$ 0,10. gatrio, empresas que esto no arquivo de fornecedores
Todos esses contratos devem ser sinalizados. Novos testes tem um baixo risco de fraude em comparao s empresas
tambm devem ser realizados para analisar se os valores no registradas. Isso acontece porque as empresas registra-
iniciais extremamente baixos so razoveis. das passam por um processo de verificao durante o pro-
Outro aplicativo9 foi desenvolvido para executar a cesso centralizado de registro. Dessa forma, h garantia de
anlise da lei de Benford nos valores iniciais do contrato. A que iro cumprir os requisitos legais do processo de licita-
lei de Benford tem sido amplamente utilizada na contabili- o governamental. Em contrapartida, contratos assinados
dade para deteco de fraudes (Nigrini 1999; Nigrini e Miller com empresas que no foram registradas esto expostos a
2009). As frequncias do primeiro ou segundo dgito dos um grande risco de fraude. Ainda existe a possibilidade de
valores iniciais dos contratos no devem exceder s sugeri- empresas, que no satisfizeram todos os requisitos legais,
das pela lei de Benford. Se este no for o caso, pode indicar ganharem contratos. Isso ocorre quando h conluio entre

69 Revista do TCU 137


Aplicativos de auditoria: uma ferramenta eficaz para assegurao de compras governamentais // Artigos

as empresas e as agncias governamentais. Um aplicativo 10 Esse aplicativo foi criado pela SAS Enterprise.
foi desenvolvido11 para ajudar a identificar contratos com
fornecedores que no foram pr cadastrados no sistema. Os 11 Esse aplicativo foi criado pela SAS Enterprise.
resultados mostram que 40.942 contratos foram assinados
com fornecedores que no foram registrados no sistema. REFERNCIAS
Mais testes de auditoria precisam ser executados, como,
Alles, M. G. 2015. Drivers of the Use and Facilitators and Obstacles
por exemplo, para analisar se as empresas cobram mais do
of the Evolution of Big Data by the Audit Profession. Accounting
que o preo de mercado e se h uma relao pessoal entre
Horizons, 29(2), pp.439-449.
os gestores das empresas e o rgo do governo etc.
Auer, S. R., C. Bizer, G. Kobilarov, J. Lehmann, R. Cyganiak, and
6. CONCLUSO Z. Ives. 2007. DBpedia: A Nucleus for a Web of Open Data. The
Semantic Web Lecture Notes in Computer Science 4825. p. 722.
Visto que contratos pblicos compem entre 10% e doi:10.1007/978-3-540-76298-0_52. ISBN 978-3-540-76297-3.
15% do PIB do pas (OCDE 2015), auditorias de compras e Cao, M., R. Chychyla, and T. Stewart. 2015. Big Data analytics in
a identificao de possveis anomalias ou fraudes so ques- financial statement audits. Accounting Horizons, 29(2), pp.423-429.
tes importantes. Esse artigo discutiu o uso e os benefcios
dos aplicativos para as auditorias de compras governamen- Dai, J., J. P. Krahel, and M. A. Vasarhelyi. 2014. Which Audit App(s)
tais. Vinte e nove aplicativos especficas foram propostos Should Auditors Use? An Exploratory Study of Using Recommender
para facilitar a auditoria dos gastos pblicos. Oito aplicati- Systems for Audit App Selection. Working Paper.
vos foram desenvolvidos para demonstrar a sua utilidade Dai, J., and Q. Li. 2016. Designing Audit Apps for Armchair Auditors to
em auditorias de contratos. Esse artigo pode fornecer ideias Analyze Government Procurement Contracts. Journal of Emerging
sobre como criar aplicativos eficazes e como usar aplicati- Technologies in Accounting. Forth coming.
vos em auditoria de contratos governamentais.
Data.gov. 2016. https://www.data.gov/open-gov/.

NOTAS Economist. 2015. Open government data: Out of the box. Available
at: http://www.economist.com/node/21678833/print.
1 Este trabalho baseado no artigo publicado no Journal of
Nigrini, M. J. 1999. I've Got Your Number: How a mathematical
Emerging Technologies in Accounting (Dai and Li 2016).
phenomenon can help CPAs uncover fraud and other irregularities.
Journal of Accountancy.
2 Por exemplo, Caseware tem mais de 50 aplicativos de auditoria
em um mercado on-line (Dai et al. 2014). Qliksense permite que Nigrini, M., and S. J. Miller. 2009. Data diagnostics using second
usurios desenvolvam aplicativos de auditoria, criando um painel order tests of Benfords Law. Auditing: A Journal of Practice and
de controle personalizado. Outras empresas, como Forestpin Theory 28 (2): 305-324.
TeamMate Analytics, tambm desenvolveram alguns produtos
OECD. 2015. Size of public procurement, in Government at a
derivados de aplicativos.
Glance 2015, OECD Publishing, Paris. Available at: http://dx.doi.
org/10.1787/gov_glance-2015-42-en.
3 Exemplos de ADAS incluem ACL e CaseWare IDEA.
O'Leary, D. E. 2015. Armchair Auditors: Crowdsourcing Analysis of
4 Exemplos de GDAS incluem R, Weka, SPSS e SAS. Government Expenditures. Journal of Emerging Technologies in
Accounting.
5 Esse aplicativo foi desenvolvido atravs de Qlik Sense Robbins Geller Rudman & Dowd LLP. 2016. Government
Procurement Fraud. http://www.whistleblower-lawfirm.com/types-
6 http://bibliotecadigital.fgv.br/dspace/bitstream/handle/10438/16274/ of-fraud-Government-Procurement-Fraud.html.
Panel%202%20-%20Gabriel%20Palma%202_0.pdf?sequence=1.
Vasarhelyi, M. A., A. Kogan, and B. M. Tuttle. 2015. Big data in
7 Esse aplicativo foi desenvolvido usando Caseware IDEA. accounting: An overview. Accounting Horizons, 29(2), pp.381-396.

WTO. 2015a. WTO and Government Procurement. Available at:


8 Esse aplicativo foi desenvolvido usando Caseware IDEA. https://www.wto.org/english/tratop_e/gproc_e/gproc_e.htm.

Yoon, K., L. Hoogduin, and L. Zhang. 2015. Big Data as complementary


9 Esse aplicativo foi desenvolvido usando Caseware IDEA.
audit evidence. Accounting Horizons, 29(2), pp.431-438.
Setembro/Dezembro 2016 70
Artigos

Modelagem de dados geogrficos


para definio de corredores
alternativos no rodoanel da
regio metropolitana de Belo
Horizonte: cenrios comparativos

Jos Irley Ferreira Jnior  Leise Kelli de Oliveira 


gegrafo com matemtica, professora
especializaes e mestrado associada da Universidade
nas reas de Geocincias Federal de Minas Gerais e
e Meio Ambiente, alm co-autora do livro Logstica
de consultor autnomo Urbana: Fundamentos
em geotecnologias e Aplicaes.
e transpor tes.

Rodrigo Affonso de
Albuquerque Nbrega 
engenheiro cartgrafo
e doutor em Engenharia
de Transportes, alm de
professor adjunto da
Universidade Federal
de Minas Gerais.

71 Revista do TCU 137


Modelagem de dados geogrficos para definio de corredores alternativos no rodoanel da regio metropolitana de Belo Horizonte: cenrios comparativos // Artigos

retranca imagem

ctrl + Shift + click para liberar


retranca

RESUMO formaes presentes no edital e no termo de referncia


do projeto, e os dados utilizados foram todos oficiais e
Dentre as iniciativas propostas pela Organizao de domnio pblico. A anlise multicritrio foi implan-
daEste trabalho tem como objetivo apresentar a meto- tada em ambiente de sistema de informaes geogrfi-
dologia utilizada no clculo de diferentes alternativas de cas utilizando a tcnica AHP em nveis hierrquicos de
corredores para viabilidade do segmento sul do Rodoa- deciso. Foram produzidos quatro cenrios que refletem
nel da Regio Metropolitana de Belo Horizonte (RMBH) interesses distintos e concorrentes: biofsico, restries
computada a partir de cenrios preditivos desenvolvidos ambientais, socioeconmico e mercadolgico/logstico.
por meio de geoprocessamento e anlise multicritrio. A Em cada cenrio foram computadas as superfcies de es-
rea de estudo engloba preocupaes extremas de nature- foro e os corredores de viabilidade. Os corredores foram
zas fsica, biolgica, econmica, social e logstica. Mesmo comparados quanto a extenso, declividade, rea urba-
contando com plena presena de unidades de conserva- na, unidades de conservao e rea vegetada. O trabalho
o, reas de recarga de gua e terrenos com topografia mostrou grande potencial de aplicao em controle exter-
muito acidentada, a regio tem sofrido fortes presses no. Os resultados mostraram que os cenrios preditivos
antrpicas, principalmente com o crescimento da mancha podem ser utilizados para fomentar anlises qualitativas e
urbana, da instalao de indstrias e entrepostos de carga, quantitativas quanto viabilidade de projetos lineares de
alm da atividade minerria. Do ponto de vista logstico, infraestrutura, ainda que em fase de publicao do edital.
a regio estratgica por concentrar as conexes entre as
rodovias BR-040 e BR-381, que interligam a RMBH ao Rio Palavras-chave: Geoprocessamento. Anlise
de Janeiro e So Paulo, respectivamente. Embora com multicritrio. Regras de deciso. Transparncia. Ava-
edital e termo de referncia lanados em 2011, o estudo liao de obras pblicas.
de viabilidade tcnica, econmica e ambiental, e o projeto
executivo do segmento sul do rodoanel no foram conclu- 1. INTRODUO
dos ou apresentados. Nesse sentido, e com o intuito de
promover elementos para anlise, controle e discusso, Embora com longa evoluo histrica, dificulda-
a proposta deste trabalho foi produzir material capaz de des existem quanto ao desenvolvimento de projetos de
qualificar e quantificar diferentes alternativas de corredo- infraestrutura viria no Brasil, sobretudo em fases de
res para o desenvolvimento do traado na infraestrutura planejamento e implementao. De acordo com Nbre-
de transportes. O modelo desenvolvido recorreu s in- ga (2013), h inadequaes em grande parte dos projetos

Setembro/Dezembro 2016 72
Artigos

quanto fase de planejamento, e a falta de transparncia estruturada das variveis geogrficas, das opinies dos
acerca dos dados e mtodos empregados nas anlises atores envolvidos, mesmo que distintas ou divergentes,
causa problemas de natureza tcnica e oramentria e das ponderaes nos pesos das variveis nas regras de
nas obras, refletindo o aumento do custo e dos prazos. tomada de deciso, com o objetivo de reproduzir cen-
Para haver um retorno efetivo da atividade de pla- rios diagnsticos e prognsticos. Para subsidiar a anlise
nejamento em transportes, de maneira transparente tanto multicritrio, desenvolvem-se metodologias para aper-
na esfera pblica quanto privada, imprescindvel que feioar o fluxo de trabalho, e estas so implantadas na
haja um pensamento sistmico dos projetos. Assim, modelagem do SIG. Cita-se nesse contexto a AHP, tcnica
vital que os profissionais envolvidos tomem decises desenvolvida por Saaty (1995) para permitir que a subje-
em conjunto e considerem a interao das variveis pre- tividade advinda das decises humanas seja minimizada
sentes em todas as fases do processo. Esse raciocnio o com a aplicao de regras matemticas no processo de
princpio da anlise multicritrio, com o suporte da tc- atribuies de peso s variveis. De acordo com Sadasi-
nica Analytic Hierarchy Process (AHP) (Saaty, 1995). Este vuni et al. (2009), esta tcnica aplicada como um mto-
modelo tem sido explorado em Sistemas de Informaes do de comparao de variveis para anlise multicritrio
Geogrficas (SIG) que permitem a modelagem espacial e se utiliza da modelagem matemtica para determinar
das variveis em um processo de tomada de deciso. prioridades, algo importante no tocante organizao das
Segundo o DNIT (BRASIL, 2012), a proposta de disparidades de valores, opinies e interesses dos agentes
construo do rodoanel caracteriza o projeto em trs envolvidos no planejamento de corredores de transporte.
segmentos: sul, norte e leste. O objeto deste trabalho Se por um lado o mtodo AHP utiliza valores
investigar, a partir das ferramentas de anlise supracita- pareados como dados de entrada, por outro lado suas
das, corredores de viabilidade para o Anel Sul, trecho informaes de sada correspondem a um ranking nu-
cujo estudo de viabilidade encontra-se em desenvolvi- mrico que elenca, ordena e atribui pesos s prefern-
mento e sem quaisquer resultados prvios apresentados. cias. No SIG, seu emprego mais frequente tem sido na
Neste contexto, esse artigo apresenta os resultados da composio dos valores atribudos aos pixels de mapas
modelagem geogrfica de dados para definir corredores digitais em formato matricial (NOBREGA et al., 2009).
alternativos que representem simultaneamente reas de Embora avanos significativos na contextualiza-
maior viabilidade econmica, tcnica e ambiental para a o geogrfica dos processos de tomada de deciso em
implantao dessa infraestrutura viria. Foram utilizados, transportes tenham sido alcanados nas dcadas de 1990
alm do edital pblico e do termo de referncia (BRASIL, e 2000, a metodologia AHP, acoplada ao SIG, tornou-se
2012), dados geogrficos de domnio pblico dos quais alvo de interesse em projetos prticos de corredores de
foram extradas as variveis ambientais, mercadolgicas, viabilidade h apenas alguns anos. No Brasil, o uso com-
logsticas e socioeconmicas utilizadas no modelo. binado de SIG e AHP em projetos de planejamento de
corredores de transportes no est restrito Academia.
2. ANLISE MULTICRITRIO E MODELAGEM Trabalhos recentes aplicados ao planejamento de ferro-
DO SIG EM TRANSPORTES vias foram desenvolvidos no mbito federal junto a gesto-
res de transportes e fiscalizao (BERBERIAN et al., 2015).
A demanda por metodologias para modernizar Essas iniciativas revelam o interesse dos gestores e tcni-
o planejamento do transporte notria e o geoproces- cos em transporte pela modernizao do processo de pla-
samento tem sido pea-chave para integrar, de forma nejamento. Os resultados tm comprovado o potencial
coordenada, as inmeras variveis espaciais deste pro- do geoprocessamento em catalisar no s a enorme gama
cesso. A insero do SIG como suporte ao planejamento de variveis envolvidas no planejamento de transportes,
de corredores de transportes demanda grande volume mas tambm em promover meios de modelar solues
de dados. De acordo com Longley et al. (2013), um SIG perante a complexidade das polticas pblicas, ambientais
caracterizado por um conjunto de construtores para e de transportes envolvidas no processo.
representar objetos, ferramentas e processos em am-
biente computadorizado, normalmente operando na 3. REA DE ESTUDO
forma de modelos de dados geogrficos.
Um dos modelos que tem sido discutido e utili- A RMBH, composta por 34 municpios, um
zado juntamente com o SIG para apoio tomada de de- polo gerador de fluxos por concentrar altas demandas
ciso a anlise multicritrio. Esta propicia a integrao de transporte para suprir as atividades comerciais, in-

73 Revista do TCU 137


Modelagem de dados geogrficos para definio de corredores alternativos no rodoanel da regio metropolitana de Belo Horizonte: cenrios comparativos // Artigos

dustriais, minerrias e de servios. interceptada por no municpio de Nova Lima, foram eleitos pelo DNIT
importantes rodovias federais como a BR-040, BR-381, para origem e destino do Anel Sul. A Figura 1 ilustra a
BR-262 e BR-356, pelas quais trafegam tambm vecu- proposta, interligando os fluxos da BR-040 e da BR-381,
los de pequeno, mdio e grande porte em circulao respectivas sadas para Rio de Janeiro e So Paulo.
interna. Visando a mitigar os problemas de congestio-
namento e segurana relativos ao excesso de veculos 4. METODOLOGIA
que obrigatoriamente cruzam essas reas urbanas, foi
proposto um rodoanel de forma a oferecer uma alterna- Para o desenvolvimento deste trabalho foram neces-
tiva externa RMBH. De acordo com o DNIT (BRASIL, srias a coleta e a construo da base de dados, tanto tabu-
2012), o Anel Sul parte integrante do projeto de um lares quanto geoespaciais. No que tange documentao
complexo virio envolvendo o Rodoanel Norte (Trevo tcnica, foram utilizados como norteador para a modelagem
da Krupp-Ravena, com 67 km de extenso) e o Anel de corredores os Termos de referncia para o estudo do tra-
Leste (Olhos Dgua-Sabar com 22 km de extenso). ado e elaborao do projeto executivo de engenharia para
A regio proposta para a ala sul do rodoanel caracte- o contorno rodovirio sul da regio metropolitana de Belo
rizada por densidade populacional elevada, atividades Horizonte BR-040/MG (BRASIL, 2012). Este documento se
industriais, reas vulnerveis e de proteo ambiental. caracteriza como Anexo I Projeto bsico para contratao
De acordo com o edital e termo de referncia, os pontos de servio segundo a alnea I, 2, Art. 7, da Lei n 8.666 de
localizados no Contorno de Betim e no Jardim Canad, 21/06/93, cujo nmero de processo o 50600.032686/2011-

Figura1:
Localizao da rea de estudo

Setembro/Dezembro 2016 74
Artigos

78 (BRASIL, 2012). Estes termos orientam quanto deter- Na sequncia, devido necessidade de emprego
minao de variveis em seu prprio texto, assim como de dados em formato matricial para a anlise multicrite-
indicam demais manuais e documentos tcnicos para con- rial utilizada no modelo, os dados originais em formato
sulta, como as Instrues de Servio (IS) e Escopos Bsicos vetorial e tabular (Tabela 1) foram convertidos para o
(EB), alm de terem sido utilizados como diretrizes para a formato matricial. A transformao de dados vetoriais
modelagem geogrfica deste trabalho. (discretos) em dados matriciais (contnuos) possibilita
As bases geogrficas (Tabela 1) que compem des- a realizao da lgebra de mapas. A Figura 2 ilustra um
te estudo foram adquiridas mediante contatos telefnicas exemplo de transformao de dados de formato vetorial
e visitas. Para facilitar a organizao, os dados foram se- para matricial e sua respectiva integrao com outros da-
parados em subconjuntos, conforme a descrio dos ter- dos matriciais para a composio da superfcie de custo
mos de referncia do Anel Sul na RMBH, informando que acumulado por meio da lgebra de mapas.
o estudo de traado dever considerar simultaneamente
questes ambientais, culturais, sociais, comunitrias, 4.2 ANLISE MULTICRITERIAL, SUPERFCIES DE
geogrficas, de engenharia e financeiras envolvidas no ESFORO E CORREDORES DE VIABILIDADE
estudo do empreendimento (BRASIL, 2012). A arquite-
tura do modelo seguiu as orientaes de Nbrega (2014). Esta etapa consistiu na aplicao da tcnica AHP
para padronizao das variveis e construo da super-
4.1 TRATAMENTO E PROCESSAMENTO DOS DADOS fcie de custo acumulado. O emprego se respaldou em
trs nveis: intravariveis, intervariveis e intergrupos,
Um procedimento essencial que antecedeu o pro- sendo este ltimo o responsvel pela integrao da su-
cessamento dos dados geogrficos foi a padronizao do perfcie de custo final. O cerne desse processo consiste
sistema de coordenadas, posto que o simples emprego na atribuio de ndices de importncia a variveis do
da projeo cartogrfica correta pode evitar inconsistn- modelo que exigem conhecimento multidisciplinar.
cias nas medies de um projeto linear de engenharia. No nvel intravarivel, cada dado de entrada foi
Neste estudo, todos os dados foram reprojetados para o analisado para que fossem convertidos em planos de in-
sistema geodsico Sirgas 2000 com projeo UTM-23S. formao do modelo. A documentao tcnica do projeto

Tabela 1:
Organizao da base de dados

Dado Escala Fonte Data Tipo Subconjunto


reas urbanizadas 1:50000 ZEE-MG (2009) 2009 Vetor
Populao 1:500000 IBGE (2010) 2010 Tabela
Assentamentos rurais 1:10000 INCRA (2015) 2015 Vetor Socioeconmico
Patrimnio arqueolgico Distncia 1:50000 IPHAN (2015) 2015 Tabela
Patrimnio histrico, artstico e cultural Distncia 1:50000 Prefeituras (2015) 2015 Tabela
Rodovias Densidade 1:10000 DNIT GEO/Vetorizao 2015 Vetor
Vias urbanas Densidade 1:50000 Open Street Map 2015 Vetor
Redes de gs Distncia 1:10000 GASMIG 2015 Vetor Mercadolgico e su-
Linhas de transmisso Distncia 1:10000 CEMIG 2015 Vetor porte logstico
Recursos minerais 1:1000000 Geodiversidade CPRM 2010 Vetor
Interesse mineral 1:1000000 DNPM - SIGMINE 2015 Vetor
Vegetao remanescente 1:150000 Landsat 8 - NDVI 2015 Raster
Nascentes Distncia das nascentes 1:1000000 IGAM 2014 Vetor
Hidrografia Densidade e distncia da hidrografia 1:1000000 IGAM 2014 Vetor
MDS - Modelo Digital de Terreno (Declividade) 1:10000 IGTEC 2009 Raster Biofsico
Vulnerabilidade Eroso 1:1500000 ZEE-MG 2009 Vetor
Risco de eroso Filito, crstico e movimento de massa 1:1000000 Geodiversidade - CPRM 2010 Vetor
Espelho dgua 1:1000000 Vetorizao 2015 Vetor
Unidade de conservao Proteo integral 1:50000 ZEE-MG 2009 Vetor
Unidade de conservao Uso sustentvel 1:50000 ZEE-MG 2009 Vetor Restries ambientais
Cavernas Distncia 1:50000 SECAV 2015 Vetor

75 Revista do TCU 137


Modelagem de dados geogrficos para definio de corredores alternativos no rodoanel da regio metropolitana de Belo Horizonte: cenrios comparativos // Artigos

Figura2:
Ilustrao do tratamento e processamento de dados empregados no modelo

foi consultada para verificar como cada varivel poderia ser como entrada para o terceiro nvel do processo AHP
explorada e quais os graus de importncia de cada classe intergrupos.
presente no dado. Tomam-se como exemplo as distncias A Figura 3 (inferior) ilustra a integrao dos gru-
euclidianas dos cursos dgua na Figura 2: enquanto o dado pos em quatro diferentes configuraes de valores, por
vetorial informa apenas a presena ou no de rio, o dado sua vez obtidos por meio de perspectivas distintas que
matricial informa o quo distante ele est. Essas distncias visaram focar a viabilidade dos corredores na preserva-
foram categorizadas e ponderadas seguindo critrios que o de interesses prprios. Cada perspectiva adotada
indiretamente refletem na possvel presena de mata ciliar, foi intencionalmente focada em defender interesses am-
no alto custo para travessia ou mesmo em solos moles e bientais, reduo de custos de engenharia, atendimento
colapsveis. Procedeu-se com a converso de dados vetor- a demanda mercadolgica/logstica, ou em minimizar
-matriz e o respectivo emprego da tcnica AHP para cada impactos socioeconmicos negativos. Como resultante
varivel, conforme ilustra a Figura 3 (superior), gerando as- foram produzidos quatro cenrios distintos, cada qual
sim planos de informao que foram integrados por grupo conservador em seus interesses, para que com isso pu-
para o desenvolvimento do segundo nvel da anlise mul- dessem ser computadas as alternativas de corredores.
ticriterial, como proposto em Nbrega (2013). Uma vez computadas as superfcies integradas de
Para o nvel intervariveis, os planos de infor- esforo para cada cenrio, estas foram utilizadas como
mao foram organizados em 4 grupos: restries am- base para simular computacionalmente o esforo pre-
bientais, biofsico, mercadolgico e suporte logstico e visto para conectar os pontos de origem e destino, pon-
socioeconmico. As ponderaes entre os diferentes tos inicial e final do projeto, localizados na BR-040 e na
planos de informao por grupo foram resultantes de BR-381, respectivamente. Esse clculo feito em duas
consultas a especialistas. Foram adotadas comparaes etapas, na qual inicialmente so computados os custos
pareadas para evitar inconsistncias nos resultados, de afastamento (esforo vs. distncia) dos dois pontos
como descrito em Sadasivuni et al. (2009). Como resul- extremos, para ento integrar os dois mapas resultantes
tado foram geradas superfcies de esforo acumulado em uma superfcie final que revela o corredor de menos
que correspondem a mapas em formato matricial onde esforo, consequentemente o de maior viabilidade se-
cada clula representada pelo valor calculado de seu gundo a perspectiva do cenrio adotado (Figura 4).
respectivo esforo (ou custo de implantao) acumula-
do das variveis que participaram da composio em 5. RESULTADOS
cada grupo. A Figura 3 (centro) ilustra esse processo
para as variveis de um grupo Biofsico. O processo Todo o desenvolvimento metodolgico teve
foi reproduzido para os demais grupos, resultando em como objetivo a gerao de corredores de transporte,
quatro superfcies de esforo acumulado que serviram cujos resultados esto apresentados na Figura 5. Assim,

Setembro/Dezembro 2016 76
Artigos

Figura 3:
Regras de deciso intravariveis, intervariveis e intergrupos utilizadas no modelo

Figura 4:
Ilustrao do processo de clculo
de um corredor de viabilidade

77 Revista do TCU 137


Modelagem de dados geogrficos para definio de corredores alternativos no rodoanel da regio metropolitana de Belo Horizonte: cenrios comparativos // Artigos

foram produzidos quatro cenrios: restries ambien- Com relao extenso das alternativas, o cenrio
tais, biofsico, socioeconmico e mercadolgico e su- ambiental produziu um corredor com 24,8 km, o cenrio
porte logstico. Estes cenrios respeitaram a origem e biofsico um corredor com 25 km, o mercadolgico com
destino presentes nos termos de referncia. 25,2 km e o cenrio socioeconmico produziu duas alterna-
A partir do desenho dos corredores foi possvel tivas com 25,2 km e 23,7 km de extenso, respectivamente.
calcular mtricas comparativas como extenso do pro- Quanto anlise de declividade do terreno, os
jeto e interseo dos corredores para com outras bases resultados mostraram que, inevitavelmente, os traados
de dados, a fim de quantificar valores para avaliar o im- dos corredores devero interceptar reas de alta decli-
pacto e comparar as alternativas. Para demonstrar esta vidade, fato justificado pela natureza geomorfolgica
anlise de sensibilidade, foram escolhidas quatro vari- da regio. Entretanto, no modelo se considerou o alto
veis que geralmente so preponderantes em avaliao esforo para transpor essas reas e a construo dos
de alternativas de corredores virios: declividade, rea corredores evitou reas com rampas acentuadas. Uma
urbana, unidades de conservao e rea vegetada. Con- sntese da declividade mdia por corredor para os quar-
tudo, a metodologia pode ser aplicada para quantificar to cenrios avaliados mostrou que o cenrio biofsico
o nmero de residncias a serem afetadas, de rios a se- apresentou menor mdia (13,7%), seguido pelo cenrio
rem transpostos ou mesmo para monetizar o impacto mercadolgico/logstico (13,9%) e o de restries am-
de cada corredor alternativo, a depender da disponibi- bientais (14,1%). O cenrio socioeconmico apresentou
lidade de dados presentes na rea de estudo. a maior mdia (14,6%).

Figura 5:
Corredores computados por cada cenrio

Setembro/Dezembro 2016 78
Artigos

Grfico 1:
Mtricas de impacto para reas urbanas, vegetadas e pertencentes a unidades
de conservao interceptadas pelos corredores dos cenrios analisados

Para as variveis rea urbana, unidades de conser- entre o Rodoanel e a BR-040 que podem produzir meno-
vao e vegetao, as reas afetadas podem ser visualiza- res impactos ambientais e possivelmente menores custos
das no Grfico 1. Em relao ao cenrio biofsico, para o de engenharia por interceptarem reas mais planas.
qual a ponderao das variveis vegetao e unidades de
conservao foi maior, observou-se que quando se pro- 6. CONCLUSO
porcionou liberdade ao modelo para construir o corredor,
os resultados se mostraram melhores, correspondendo a Na realizao desse trabalho, deparamos com
menores reas impactadas. No subconjunto socioecon- diversos desafios a respeito da interpretao dos ter-
mico, o qual evidencia a preferncia pelo distanciamento mos de referncia e da documentao tcnica e pro-
das reas urbanas, observou-se que o resultado alcanou cessamento de dados. Todavia o objetivo principal
o menor impacto dentre todos os cenrios avaliados. de obter traados alternativos para o Rodoanel Sul da
Contudo, as anlises revelam que existem di- regio metropolitana de Belo Horizonte a partir de
versas possibilidades de uso quando se identifica o que perspectivas distintas, realsticas e confrontantes foi
sofrer interveno e quanto. O modelo permite aper- atingindo. Foram gerados corredores considerando
feioar as anlises de risco e otimizar o preenchimento diferentes variveis, baseados no emprego de geotec-
da matriz de impacto ambiental utilizada para avaliar nologias e anlise multicriterial. Os resultados per-
as alternativas do projeto. mitiram uma interao harmnica entre a aplicao
Outras duas propostas foram desenvolvidas con- desta tcnica e a modelagem de dados geogrficos. A
siderando os cenrios biofsico e socioeconmico, tendo capacidade operacional do modelo em processar re-
como origem o ponto institudo pelo DNIT na BR-381 e as extensas com profundo detalhamento contextual
como destino a BR-040, sem a definio de uma locali- das anlises, bem como a otimizao do tempo e da
dade especfica (Figura 7). A idia foi verificar se o local capacidade analtica dos atores envolvidos no modelo
na BR-040 apresentado no edital corresponde ao local de contribuem de forma positiva para a modernizao do
maior viabilidade segundo os critrios adotados nesta in- processo de planejamento de transportes.
vestigao. Embora no quantificadas, as anlises preli- O trabalho piloto de anlise multicritrio espacial
minares indicam que o ponto de origem apresentado no mostrou grande potencial de aplicao em controle externo.
edital do projeto justificado quando considerado a ne- Acredita-se que, de posse do modelo e de seu conhecimen-
cessidade de distanciar o rodoanel de reas urbanas exis- to operacional, as aes de fiscalizao e controle externo
tentes, todavia o modelo apontou alternativas de conexo podero ser desenvolvidas com maior agilidade e acurcia.

79 Revista do TCU 137


Modelagem de dados geogrficos para definio de corredores alternativos no rodoanel da regio metropolitana de Belo Horizonte: cenrios comparativos // Artigos

Figura 7:
Processamento alternativo para testar a aderncia dos pontos
de origem e destino publicados no edital do projeto

Os corredores resultantes desse trabalho ainda no po- LONGLEY, P. A. et al. Sistemas e cincia da informao
dem ser comparados ao traado oficial do Rodoanel da RMBH, geogrfica. 3. ed. Porto Alegre: Bookman, 2013.
posto que este no apresenta a fase de estudo de viabilidade
concluda. Espera-se que mtricas comparativas possam ser NOBREGA, R. A. A. Ferrovia Norte-Sul: estudo dos traados
quantificadas e analisadas a partir do trmino do projeto por alternativos para escoamento eficiente da produo. In: ENCONTRO
parte do DNIT ou de sua apresentao para a comunidade. REGIONAL DA 3 CMARA DE COORDENAO E REVISO DO
MINISTRIO PBLICO FEDERAL REGIES SUL/SUDESTE, 2., 2013,
7. AGRADECIMENTOS Florianpolis. Anais Florianpolis, 17 out. 2013.

Os autores agradecem ao CNPq pelo auxlio no ______. Relatrio de fechamento de projeto de extenso: ligao
desenvolvimento da pesquisa. Pato Branco/PR Cruz Alta/RS. Belo Horizonte: UFMG, 2014.

REFERNCIAS NOBREGA, R. A. A. et al. Bridging decision-making process and


environmental needs in corridor planning. Manegement of
BERBERIAN, C. F. Q. et al. O uso de geotecnologias como uma Environmental Quality: an International Journal, Mississippi, v.
nova ferramenta para o controle externo. Revista do Tribunal 20, n. 6, p. 622-637, 2009.
de Contas da Unio, Braslia, DF, n. 133, p. 40-53, 2015.
SAATY, T. L. Transport planning with multiple criteria: the analytic
BRASIL. DNIT Departamento Nacional de Infraestrutura de hierarchy process applications and progress review. Journal of
Transportes. Coordenao Geral de Cadastro e Licitaes. Advanced Transportation, New York, v. 29, n. 1, p. 81-126, 1995.
Termos de referncia para o estudo do traado e elaborao
do projeto executivo de engenharia para o contorno SADASIVUNI, R. et al. A Transportation corridor case study for
rodovirio sul da regio metropolitana de Belo Horizonte multi-criteria decision analysis. In: ASPRS ANNUAL CONFERENCE,
BR-040/MG. DNIT, Belo Horizonte, edital n 0240/2012-00, 2009, Maryland. Anais Maryland, 9-13 mar. 2009.
processo n 50600.032686/2011-78, p. 79-157, 2012.

Setembro/Dezembro 2016 80
Artigos

O potencial de dados de
sensoriamento remoto na
fiscalizao de obras pblicas

Osmar Ablio de Carvalho Roberto Arnaldo Trancoso


Jnior  Gomes 
gelogo e doutor em Geologia gegrafo e doutor em Geografia
pela Universidade de Braslia, pela Universidade Federal do Rio
onde atua como professor. de Janeiro, alm de professor
na Universidade de Braslia.

Renato Fontes Guimares 


engenheiro cartgrafo com
doutorado em Geologia,
alm de professor na
Universidade de Braslia.

81 Revista do TCU 137


O potencial de dados de sensoriamento remoto na fiscalizao de obras pblicas // Artigos

retranca imagem

ctrl + Shift + click para liberar


retranca

RESUMO adotado. Pesquisas especficas para cada tipo de obra


devem ser realizadas demonstrando o potencial real
Este artigo analisa as potenciais aplicaes de tc- da deteco remota para a fiscalizao em ambientes
nicas de sensoriamento remoto para a fiscalizao e o urbanos ou rurais.
monitoramento de obras de infraestrutura. Atualmente,
existe uma ampla disponibilidade de dados de senso- Palavras-chave: Sensoriamento Remoto, de-
riamento remoto provenientes de diferentes sensores e teco de mudana, modelo digital de elevao, classi-
plataformas, constituindo uma fonte de informao r- ficao espectral
pida e til para descrever a composio dos elementos
presentes na superfcie e as suas mudanas ao longo do 1. INTRODUO
tempo. O aprimoramento dos sensores remotos com
o aumento da resoluo espacial, temporal e espectral A fiscalizao efetiva das obras pblicas um
embarcados em diferentes plataformas (satlites, aero- fator preponderante para a minimizao dos gastos p-
naves e veculos areos no tripulados) tem ampliado blicos. Como exemplificao, auditorias realizadas pelo
as perspectivas de estudos e aplicaes dos dados de Fiscobras (plano anual de fiscalizao de obras do TCU)
sensoriamento remoto, incluindo-se o monitoramento no estado do Rio Grande do Norte durante o perodo
de infraestruturas pblicas em construo ou em conces- 2011-2012 proporcionaram uma economia aos cofres
ses. A extrao de modelos digitais de elevao a partir pblicos de R$ 119.529.497,78 (SOUZA; BATISTA,
de sensores remotos tambm constitui um importante 2013). O Fiscobras no ano de 2015 realizou 97 audito-
atributo para descrever as feies de obras de infraes- rias, totalizando um volume de recursos fiscalizados de
trutura. Os estudos mais comumente encontrados na R$ 31 bilhes, em que 61 obras (62,9%) evidenciaram
literatura so referentes s feies urbanas e rodovias, indcios de irregularidades graves (BRASIL, 2015).
sendo ainda pouco relatado estudos sobre fiscalizao No entanto, a dimenso continental do territrio
e monitoramento de obras, o que consiste em amplo brasileiro dificulta o processo tradicional de fiscalizao,
campo de pesquisa e inovao. Inmeras tcnicas de que exige uma atuao constante de profissionais no
deteco de mudana tm sido propostas e avaliadas local. A necessidade crescente de infraestruturas para o
para diferentes ambientes e alvos, devendo em cada crescimento econmico de longo prazo do pas aliado ao
tipo de ambiente e alvo realizar comparaes e anlise alto grau de irregularidades torna premente o aprimora-
de acurcia para definir o melhor procedimento a ser mento tecnolgico para obter uma fiscalizao contnua

Setembro/Dezembro 2016 82
Artigos

das obras pblicas em execuo ou concesso em todo o em relao ao que foi executado em cada obra, tanto na
territrio nacional (MIRANDA; MATOS, 2015; VITAL dimenso espacial como temporal. Essa abordagem per-
et al., 2015). No processo de fiscalizao fundamental mite que se compare o cronograma pr-estabelecido da
obter informaes precisas sobre a evoluo das obras obra com o andamento real, permitindo reconstruir de
pblicas (construo, reforma, fabricao, recupera- forma total ou parcial o histrico financeiro e executivo.
o ou ampliao de bem pblico), buscando detectar Contudo, o emprego de imagens para a fiscali-
eventuais inconsistncias ou inexistncia dos elementos zao de obras pblicas apresentam dificuldades simi-
presentes no projeto bsico e nas especificaes tcni- lares aos descritos no mapeamento de feies de reas
cas. Nessa conjuntura, o sensoriamento remoto pode urbanas, tais como (CAVALLI et al., 2008; WENTZ et
ser uma importante ferramenta, proporcionando um al., 2014): (a) os espectros dos pixels de ambientes ur-
monitoramento peridico de extensas reas com baixo banos so constitudos por misturas espectrais devido
custo. Nos ltimos anos, extensos esforos de pesquisa alta heterogeneidade desses ambientes, podendo gerar
tm sido feitos para a deteco de mudanas utilizando confuses entre as classes no processo de classificao,
imagens de sensoriamento remoto em diferentes cen- e (b) as estruturas fsicas das classes urbanas variam es-
rios: (a) urbanos (HEGAZY; KALOOP, 2015; SUN et al., pacialmente, considerando diferentes composies de
2013); (b) agrcolas (MENKE et al., 2009; OLIVEIRA et telhados, pavimentos e formas arquitetnicas. Assim,
al., 2014); e (c) reas naturais e de preservao ambien- as obras de infraestrutura (edificaes, pontes, estradas,
tal (COPPIN; BAUER, 1996; YADAV; KAPOOR; SAR- hidrovias, ferrovias, entre outros) so constitudas por
MA, 2012). Portanto, o sensoriamento remoto tem sido diferentes materiais (asfalto, pinturas, concreto, metal,
amplamente utilizado para avaliar a dinmica espacial vidro, telhas, vegetao e solo) que esto combinados
da superfcie terrestre e a eficcia do planejamento ter- em diferentes propores (JENSEN; COWEN, 1999). Por
ritorial. Especificamente, estudos sobre a fiscalizao exemplo, duas pontes podem ter comportamentos dife-
de obras pblicas usando sensoriamento remoto so renciados tanto pelo tipo de materiais utilizados como
pouco relatados nos peridicos cientficos. A ausncia pelas suas diferenas arquitetnicas. Alm disso, outro
de pesquisa para aplicao dessa tcnica demonstra um fator de complexidade que durante a evoluo de uma
extenso campo para inovaes cientficas, contendo re- obra ocorre uma intensa modificao dos elementos e
levncia econmica e retorno imediato para a sociedade. padres de construo. Portanto, o acompanhamento de
O acervo de imagens multitemporais possibilita forne- uma obra por sensoriamento remoto exige a obteno de
cer subsdios para a comparao do que foi planejado informaes constantes e detalhadas, alm da elaborao

83 Revista do TCU 137


O potencial de dados de sensoriamento remoto na fiscalizao de obras pblicas // Artigos

de uma metodologia especializada de processamento di-


gital de imagens. Diferentes tcnicas para a deteco de
feies urbanas consolidadas ou em construes podem
ser utilizadas. Normalmente, o mtodo de interpretao
visual considerado o de maior acurcia, mas tambm
o mais demorado e caro. Alternativa para interpreta-
o visual utilizar classificaes supervisionadas, no
supervisionadas ou abordagens de sistema especialista
sem superviso e baseada no conhecimento (JAT; GARG;
KHARE, 2006). Alm disso, tcnicas de deteco de mu-
dana devem ser adotadas, considerando as diferentes
abordagens de pr-classificao ou ps-classificao.
No presente trabalho so discutidas as questes re-
lacionadas ao emprego do sensoriamento remoto na fisca-
lizao das obras pblicas. A definio das imagens a serem
utilizadas avaliada considerando os avanos ocorridos na
melhoria dos atributos espaciais, espectrais, temporais e a
na extrao de dados altimtricos. Os progressos obtidos
com o aumento das diferentes resolues das imagens re-
sultam em novos mtodos para o tratamento e anlise dos
dados, com implicaes na eficincia da fiscalizao por
sensoriamento remoto. Alm disso, o presente trabalho captar as estruturas urbanas de 5 metros, tambm
apresenta uma reviso dos principais mtodos de deteco aplicvel para as obras de engenharia.
de mudana, por ser um conjunto de procedimentos bsicos As imagens de alta resoluo espacial em am-
que permite acompanhar as alteraes no decorrer da obra bientes urbanos permitem utilizar os elementos bsicos
e avaliar o seu ajuste ao projeto inicial. de interpretao (tom, cor, textura, forma, tamanho,
orientao, padro, sombra, local e situao dos obje-
2. CARACTERSTICAS DA RESOLUO tos na paisagem urbana) para identificar e julgar o seu
TEMPORAL, ESPECTRAL E ESPACIAL significado. Atualmente, diferentes imagens de sensores
DOS SENSORES REMOTOS NA orbitais de alta resoluo espacial (inferior a 4 metros)
FISCALIZAO DE OBRAS esto disponveis no mercado, destacando: GeoEye-1
(0,46m), WorldView-1 e 2 (0,46 m), WorldView-3 e 4
2.1 RESOLUO ESPACIAL (0,31 m), Pleiades-1A e 1B (0,5 m), Kompsat-3A (0,55 m)
e 3 (0,7 m), QuickBird (0,65), Gaofen-2 (0,8 m), TripleSat
A definio das classes referentes s obras de en- (0,8 m), Ikonos (0,82m), SkySat-1 e 2 (0,9m) e Spot-6 e
genharia por sensoriamento remoto e suas implicaes 7 (1,5 m) (Tabela 1). O aumento da oferta de imagens
no cumprimento legal altamente dependente da re- de alta resoluo espacial provenientes de satlites co-
soluo espacial (tamanho do pixel), espectral (nmero merciais proporcionou um crescimento de tcnicas de
de bandas espectrais) e temporal (perodo de revisita do processamento digital de imagens visando estudos de
mesmo local na superfcie terrestre) da imagem. Os trs infraestrutura, redes rodovirias e elementos urbanos.
fatores so importantes, mas prioritariamente a imagem Uma importante inovao no mapeamento de
deve conter uma alta resoluo espacial para que pos- reas urbanas usando imagens de alta resoluo espacial
sam ser individualizados os objetos presentes em uma o emprego da anlise de imagem baseada em objetos
obra. No adianta ter uma alta resoluo espectral se geoespaciais (Geobia), que se diferencia dos tradicionais
em um pixel existem diferentes elementos urbanos e mtodos baseados em pixels. Na Geobia, a imagem
comportamentos espectrais misturados. Normalmente, segmentada em regies relativamente homogneas (obje-
a identificao de um objeto urbano em uma imagem tos de imagem) antes da classificao (BLASCHKE, 2010;
precisa ter uma representao mnima de quatro pixels MYINT et al., 2011). Assim, a classificao utiliza como
(COWEN et al., 1995; JENSEN; COWEN, 1999). Con- unidade bsica os segmentos e seus atributos em vez dos
forme Small (2003), a resoluo espacial mnima para pixels. O alto grau de variabilidade espectral dentro de uma

Setembro/Dezembro 2016 84
Artigos

Tabela 1:
Descrio dos principais satlites orbitais. As imagens disponveis gratuitamente so demarcadas com um asterisco (*)
SATLITES DISPONVEIS RESOLUO ESPACIAL RESOLUO TEMPORAL RESOLUO ESPECTRAL
2,5 m Varivel 1 banda pancromtica
ALOS 10 m Varivel 3 bandas no visvel
10 a 100 m Varivel 1 banda no infravermelho
CARTOSAT 2,5 m 5 dias 1 banda pancromtica
5m Varivel 1 banda (pancromtica)
2 bandas no visvel
10 m Varivel
1 banda no infravermelho
3 bandas no visvel
20 m 26 dias
1 banda no infravermelho
CBERS*
1 banda pancromtica
40 m 26 dias
2 bandas no infravermelho
80 m 26 dias 1 banda no termal
3 bandas no visvel
64 m 5 dias
1 banda no infravermelho
EROS 0,7 m Programado 1 banda (pancromtica)
2m Programado 1 banda (pancromtica)
FORMOSAT 3 bandas no visvel
8m Programado
1 banda no infravermelho
0,8 m 5 dias 1 banda (pancromtica)
GAOFEN 3 bandas no visvel
3,2 m 5 dias
1 banda no infravermelho
0,5 m Programado 1 banda (pancromtica)
GEOEYE 3 bandas no visvel
2m Programado
1 banda no infravermelho
1m Varivel 1 banda pancromtica
IKONOS 3 bandas no visvel
4m Varivel
1 banda no infravermelho
1m Programado 1 banda pancromtica
KAZEOSAT-1 3 bandas no visvel
4m Programado
1 banda no infravermelho
1m Programado 1 banda pancromtica
KOMPSAT 2 3 bandas no visvel
4m Programado
1 banda no infravermelho
0,7 m Diria (possvel) 1 banda pancromtica
KOMPSAT 3 3 bandas no visvel
2,8 m Diria (possvel)
1 banda no infravermelho
0,55 m Diria (possvel) 1 banda pancromtica
KOMPSAT 3A 2,2 m Diria (possvel) 3 bandas no visvel
5,5 m Diria (possvel) 2 bandas no infravermelho
3 bandas no visvel
30 m 16 dias
LANDSAT 5* 3 bandas no infravermelho
120 m 16 dias 1 banda no termal
15 m 16 dias 1 banda pancromtica
3 bandas no visvel
LANDSAT 7* 30 m 16 dias
3 bandas no infravermelho
60 m 16 dias 1 banda no termal
15 m 16 dias 1 banda pancromtica
4 bandas no visvel
3 bandas no infravermelho
LANDSAT 8 30 m 16 dias
1 banda aerossol
1 banda cirrus
100 m 16 dias 2 bandas no termal

85 Revista do TCU 137


O potencial de dados de sensoriamento remoto na fiscalizao de obras pblicas // Artigos

SATLITES DISPONVEIS RESOLUO ESPACIAL RESOLUO TEMPORAL RESOLUO ESPECTRAL


0,5 m Diria (possvel) 1 banda pancromtica
PLEIADES 3 bandas no visvel
2m Diria (possvel)
1 banda no infravermelho
4 bandas no visvel
RAPIDEYE 5m Programado
1 banda no infravermelho
SENTINEL 1* 5 a 20 m 12 dias Diferentes bandas no radar
3 bandas no visvel
10 m
1 banda no infravermelho
4 bandas red edge
20 m
SENTINEL 2* 10 dias com possibilidade de 5 dias 2 bandas no infravermelho
1 banda aerossol
60 m 1 banda cirrus
1 banda vapor dgua
1,5 m Diria (possvel) 1 banda pancromtica
SPOT 3 bandas no visvel
6m Diria (possvel)
1 banda no infravermelho
1 banda pancromtica (possibilidade
1,1 m Programado
de gerar um vdeo de 90 segundos)
SKYSAT
3 bandas no visvel
2m Programado
1 banda no infravermelho
TERRASAR-X 0,25 a 40 m Programado Diferentes bandas no radar
2m Programado 1 banda pancromtica
TH-01 3 bandas no visvel
10 m Programado
1 banda no infravermelho
1m Programado 1 banda pancromtica
TRIPLESAT 3 bandas no visvel
4m Programado
1 banda no infravermelho
0,3 m Programado 1 banda pancromtica
1 banda aerossol
4 bandas no visvel
1,24 m Programado
1 banda red edge
WORLD VIEW
2 bandas no infravermelho
3,7 m Programado 8 bandas no infravermelho
12 bandas Cavis (nuvens, aerossis,
30 m Programado
vapor, gelo e neve)
1 banda no visvel
250 m
1 banda no infravermelho
2 bandas no visvel
TERRA/AQUA 500 m
1-2 dias 3 bandas no infravermelho
(Sensor-MODIS)*
7 bandas no visvel
1000 m 16 bandas no infravermelho
6 bandas no termal
2 bandas no visvel
15 m
TERRA 1 banda no infravermelho
Varivel
(Sensor ASTER)* 30 m 6 bandas no infravermelho
90 m 5 bandas no termal

Setembro/Dezembro 2016 86
Artigos

classe (sombras, ngulo do sol, as lacunas na copa das r- para diferentes alvos a partir de espectrmetros de cam-
vores etc.) pode dificultar a classificao baseada em pixel po ou laboratrio para servir de suporte classificao,
e favorecer tcnicas baseadas em objetos que so represen- tais como elementos urbanos (BEN-DOR; LEVIN; SA-
tados por valores mdios do segmento (YU et al., 2006). ARONI, 2001; HEROLD et al., 2004), minerais (CLARK
Um problema da classificao baseada em obje- et al., 2007), plantaes (RAO; GARG; GHOSH, 2007) e
tos a dependncia da etapa de segmentao, que pode reas alagadas (ZOMER; TRABUCCO; USTIN, 2009).
gerar segmentos em excesso ou em quantidade reduzi- O advento das imagens hiperspectrais (Figura 1),
da em relao s feies do terreno (LIU; XIA, 2010). caracterizadas por conter centenas de bandas espectrais
Normalmente, a falta de segmentos considerada pior estreitas e contnuas no espectro solar refletido, permitiu
do que o excesso (KIM; MADDEN; WARNER, 2009). A o desenvolvimento de novas tcnicas que aprimoraram
minimizao desse tipo de erro pode ser obtida atravs a deteco e quantificao dos materiais (CARVALHO
de sucessivos testes de segmentaes antes da classifica- JNIOR et al., 2003). A classificao espectral busca
o (TRIAS-SANZ; STAMON; LOUCHET, 2008) e por converter os sinais espectrais que refletem as coberturas
anlise de acurcia dos segmentos (DORREN; MAIER; urbanas em categorias que representam a natureza fsica
SEIJMONSBERGEN, 2003; KIM; MADDEN; XU, 2010). da superfcie. Alm disso, essas imagens permitem uma
anlise espectral subpixel com a estimativa de abundn-
2.2 RESOLUO ESPECTRAL cia dos materiais superficiais contidos no pixel a partir
da anlise linear de mistura (PHINN et al., 2002; WU;
O conhecimento pormenorizado das caracte- MURRAY, 2003) e sua variao Multiple Endmember
rsticas espectrais permite uma acurada identificao Spectral Mixture Models (MESMA) (DEMARCHI et al.,
dos elementos superficiais. Nesse propsito, diversos 2012; FRANKE et al., 2009). Essa abordagem possibilita
estudos desenvolvem bibliotecas espectrais especficas tratar o problema de heterogeneidade espectral dentro

Figura 1:
Concepo do sensor hiperescpectral AVIRIS, segundo a qual a alta resoluo espectral torna a informao de um dado pixel
prxima obtida por meio de medies realizadas em laboratrio e/ou campo. (Modificado de GREEN et al., 1998).

87 Revista do TCU 137


O potencial de dados de sensoriamento remoto na fiscalizao de obras pblicas // Artigos

de uma mesma classe, que uma das principais dificul- (ABADE et al., 2015), fitofisionomias (CARVALHO J-
dades em reas urbanas (HEIDEN; SEGL; KAUFMANN, NIOR; HERMUCHE; GUIMARES, 2006; CARVALHO
2007). Um mesmo tipo de classe pode ser caracterizado JNIOR et al., 2008) e plantios (COUTO JNIOR; CAR-
por diversos materiais distintos espectralmente ou ter VALHO JNIOR; MARTINS, 2012; SAKAMOTO et al.,
composies diferenciadas devido deteriorao ao 2005). Essa abordagem permite detectar eventos naturais
longo do tempo (DEMARCHI et al., 2012). Por exem- singulares, tais como fogo (CARVALHO JNIOR et al.
plo, os telhados podem ser constitudos por diferentes 2015) e inundaes (AIRES et al., 2014).
materiais e, alm disso, modificar o seu comportamento Na fiscalizao de obras de engenharia, funda-
espectral devido ao acmulo de fungos e sujeira. mental avaliar a resoluo temporal dos sensores remotos.
Normalmente, as imagens hiperespectrais mais utili- A obra progride atravs de um calendrio programado que
zadas nos estudos urbanos so do sensor Hyperion a bordo permite estabelecer quais sensores possuem adequadas re-
do satlite EO-1 e os provenientes de sensores embarcados solues temporais para a sua fiscalizao. As condies
em aeronaves, como o Airborne Visible Infrared Imaging climticas (interferncia atmosfrica e cobertura de nuvem)
Spectrometer (AVIRIS), Compact Airborne Spectrographic tambm afetam a aquisio de imagens, podendo ser cr-
Imager (CASI) e o Hyperspectral Mapper (HyMap). ticas para sensores pticos em algumas localidades, como
na regio amaznica. Nesse caso, deve-se buscar satlites
2.3 RESOLUO TEMPORAL de alta frequncia de revisita para a seleo de imagens ou
adotar sensores de imagem radar.
O advento de sensores orbitais com alta resoluo Os sensores de alta resoluo temporal possuem
temporal tem promovido uma nova abordagem na clas- normalmente baixa resoluo espacial, como o caso
sificao de alvos superficiais, que consideram aspectos do sensor MODIS e o Advanced Very High Resolution
de mudanas cclicas ou com trajetrias conhecidas de Radiometer (AVHRR). No entanto, muitas misses
um evento ou de um objeto que podem ser descritas e utilizam uma constelao de satlites idnticos que
identificadas por uma assinatura temporal. A similaridade orbitam a Terra de forma sincronizada, permitindo
espectral entre os diferentes tipos de vegetao, caracte- uma sucesso de imagens com alto grau de revisita e
rizadas por serem constitudas pelas mesmas feies de alta resoluo espacial, como o caso dos seguintes
absoro, pode apresentar dificuldades para serem dis- programas orbitais: Rapideye (5 satlites); Triplesat (3
tinguidas a partir de uma nica imagem no tempo. No satlites); Pleiades (2 satlites) e o Spot 6-7 (2 satlites).
entanto, sries temporais de sensoriamento remoto per- Apesar de sries temporais constitudas com imagens
mitem estabelecer uma assinatura fenolgica caractersti- com mesmas especificaes facilitar o desenvolvimen-
ca, identificando diferentes tipos de ecossistemas naturais to de mtodos automatizados, estudos conciliando

Setembro/Dezembro 2016 88
Artigos

imagens de diferentes sensores tornam-se um desafio retorno das diferenas de fase das ondas para o satlite.
de pesquisa. Dentre os MDEs provenientes desse mtodo, destacam-
-se o Radarsat 1 e 2, Sentinel 1 e SRTM, sendo este l-
2.4 MODELOS DIGITAIS DE ELEVAO timo o mais utilizado mundialmente (JARIHANI et al.,
2015; MUSA; POPESCU; MYNETT, 2015). Esses pro-
Os modelos digitais de elevao (MDE) so repre- dutos tm a vantagem de mapear de forma contnua,
sentaes em 3D da superfcie terrestre que reproduzem mesmo com a cobertura de nuvens. A Figura 2 mostra
as feies naturais e antrpicas da paisagem. A constru- um exemplo de MDE de uma rea urbana (A) e uma
o desses modelos inicia-se a partir de fotografias areas fotografia area sobreposta a este MDE (B).
analgicas e passa a ser desenvolvida por outras tecno- A produo de MDEs a partir de radar laser, que
logias, tais como: fotografia area digital, sensor tico mede a distncia entre um sensor e um alvo baseado na
orbital de alta resoluo, radar interferomtrico e radar metade do tempo gasto entre a emisso e deteco do
laser aerotransportado. Atualmente, veculos areos no pulso (BALTSAVIAS, 1999), j possui algumas dcadas.
tripulados (VANT) carregam a bordo esses diferentes sen- Porm, grandes avanos tecnolgicos nos ltimos anos
sores que elaboram MDEs. Recentemente, os sensores possibilitaram identificar tnues mudanas de eleva-
de radar laser mvel podem ser acoplados em qualquer o a partir de densa nuvem de pontos, possibilitando
plataforma (um barco, um automvel etc.). mapear e distinguir objetos com pequenas variaes
Os sensores ticos a bordo de satlites mapeiam a de textura (MENG; CURRIT; ZHAO, 2010). Os sen-
superfcie terrestre em dois pontos de vista distintos, pos- sores laser podem ser acoplados em aeronaves, sat-
sibilitando a extrao de MDEs. Dentre eles destacam-se lites e veculos areos no tripulados. Recentemente
satlites com diferentes resolues espaciais, desenvol- foi desenvolvido o sistema mvel de varredura a laser
vidos por agncias espaciais, tais como a srie Spot, IRS, que adquire dados em 2D e 3D e que so implanta-
Cartosat-1, Alos-Prism, WorldView-2, QuickBird-2, Iko- dos em qualquer plataforma mvel terrestre ou nu-
nos-2, Aster, entre muitos outros. A aquisio dos dados tica (PUENTE et al., 2013). Essa tecnologia apresenta
pode ser ao longo de uma nica linha de varredura (Spot) grandes vantagens, tais como: (a) diminuio de custo
ou adquirido paralelamente com uma rea de superposio devido captura de dados em alta velocidade; (b) alta
(QuickBird) (POLI; TOUTIN, 2012). As imagens orbitais densidade de pontos, garantindo um levantamento
vm preenchendo a lacuna na produo de MDEs precisos, planialtimtrico completo que diminui o nmero de
porm cmeras areas de ltima gerao a bordo de avies, dados questionveis; e (c) visualizao 3D que permi-
como a ADS 80, produzem atualmente preciso compa- te verificar se os objetos mapeados correspondem s
tvel com imagens de sensores remotos de alta resoluo, condies do mundo real.
como o Worldview (HOBI; GINZLER, 2012). Os MDEs so amplamente utilizados na deteco
Os MDEs elaborados por Interferometric Syn- e descrio de feies urbanas (KIM; NEVATIA, 2004).
thetic Aperture Radar (InSAR) so obtidos a partir do No entanto, as obstrues no ambiente urbano denso ain-

Figura 2:
MDE de rea urbana (A) e Fotografia area sobreposta ao MDE (B).

A B

89 Revista do TCU 137


O potencial de dados de sensoriamento remoto na fiscalizao de obras pblicas // Artigos

da so um grande obstculo para o mapeamento, sendo


necessrias metodologias para suprir a falta de informa-
o e insuficincia de textura para identificar as feies
(DURUPT; TAILLANDIER, 2006). Novas tecnologias que
utilizam radar laser, como o Light Detection and Ranging
(Lidar), esto sendo desenvolvidas para reproduo em
3D das feies antrpicas com alta resoluo, porm a sua
cobertura limitada, e a aquisio de dados e o processa-
mento demandam um alto custo (BAUGH et al., 2013).

3. PROCESSAMENTO DIGITAL DE
IMAGENS E DETECO DE MUDANA

As tcnicas de deteco de mudana usando sen-


soriamento remoto podem fornecer importantes infor-
maes para o monitoramento de obras de engenharia e
infraestrutura, como: (a) a rea e a taxa em que as cons-
trues so desenvolvidas; (b) a distribuio e a relao
espacial dos tipos de mudanas avaliando o desempenho
relativo das atividades da construo civil com o crono- mosfricas. Esses mtodos so subdivididos em dois
grama previsto; (c) a definio da trajetria de mudana tipos: absoluta e relativa.
estabelecendo a sucesso dos eventos e as eventuais pa- A correo radiomtrica absoluta utiliza cdigos
ralizaes; e (d) a elaborao de uma representao car- de transferncia radiativa para obter a reflectncia na
togrfica que auxilie e evidencie os problemas existentes superfcie da Terra, eliminando as interferncias atmos-
espacialmente, favorecendo as aes de fiscalizao. Para fricas. As principais interferncias atmosfricas so pro-
tanto, uma anlise pormenorizada deve ser feita em rela- venientes de dois efeitos: (a) espalhamento (difuso ou
o aos mtodos existentes, efetuando testes e combina- disperso) que muda a direo de propagao da radiao
es de procedimentos para obter o melhor tratamento solar por interao elstica com particulados, principal-
dos dados a partir de uma anlise de acurcia. mente aerossis; e (b) absoro atmosfrica, com perda
efetiva de energia em comprimentos de onda especficos,
3.1 PR-PROCESSAMENTO principalmente provenientes de sete gases: vapor dgua
(H2O), dixido de carbono (CO2), oznio (O3), xido n-
Normalmente, na deteco de mudana so des- trico (N2O), monxido de carbono (CO), metano (CH4)
critas duas etapas de pr-processamento: (a) correo e oxignio (O2) (ZULLO JNIOR, 1994). No entanto, a
geomtrica; e (b) calibrao radiomtrica (ALMUTAIRI; correo dos efeitos atmosfricos mais efetiva usando
WARNER, 2010). A correo geomtrica permite a jus- sensores hiperespectrais que contem bandas exclusivas
taposio dos pixels de uma mesma rea no terreno e de para os diferentes gases e efetua a correo para cada pi-
tempos diferentes, eliminando a existncia de alguma xel. No caso das imagens multiespectrais, so adotados
distoro sistemtica. O registro geomtrico incorreto valores constantes para toda a imagem.
danifica a preciso da deteco de mudana, gerando As correes relativas normalizam os valores
falsos artefatos artificiais que no correspondem s fei- digitais para uma escala comum, na qual feies inva-
es superficiais. Assim, as imagens devem ter uma per- riantes entre as duas imagens so ajustadas para uma
feita sobreposio, possuindo uma raiz de erro mdio nica referncia, assumindo que esses pixels so linear-
quadrtico de no mximo 0,2 pixels para alcanar um mente correlacionados (DU; TEILLET; CIHLAR, 2002).
erro de apenas 10% (TOWNSHEND et al., 1992; DAI; Portanto, a questo principal torna-se a obteno das
KHORRAM, 1999). feies invariantes para efetuar a regresso linear entre
A calibrao radiomtrica remove as alteraes as imagens temporais, podendo ser determinadas por
causadas por fatores externos, tais como: mudanas na inspeo visual ou computacionalmente. Vrios mto-
calibrao do sensor ao longo do tempo, ngulo solar, dos automatizados foram propostos para encontrar os
variabilidade na distncia Terra-Sol e interferncias at- pontos invariantes e efetuar a normalizao entre as

Setembro/Dezembro 2016 90
Artigos

imagens, destacando: regresso linear robusta (HEO; 2005): (a) pr-classificao, na qual inicialmente gerada
FITZHUGH, 2000) densidade no diagrama de frequn- uma nova imagem realando as feies de mudana e
cia (SONG et al., 2001; CHEN; VIERLING; DEERING, depois realiza-se a etapa de classificao; e (b) ps-classi-
2005); medidas espectrais de distncia e similaridades ficao, na qual inicialmente realiza-se uma classificao
(CARVALHO JNIOR et al., 2013), medidas espectrais independente para cada tempo e em seguida efetua-se a
entre componentes cannicas (CANTY; NIELSEN; SCH- extrao e quantificao das reas de mudana a partir
MIDT, 2004); e zonas de no mudana envolta da linha da tabulao cruzada entre as imagens temporais.
de regresso (ELVIDGE et al., 1995) ou de componentes Diferentes mtodos de pr-classificao fo-
principais (DU et al., 2002). Com o propsito de aglu- ram propostos: (a) operaes algbricas de subtrao
tinar todas essas tcnicas, Carvalho Jnior et al. (2013) e diviso de imagens multitemporais (COPPIN et al.,
propuseram um mtodo sequencial para a determina- 2001; FRANKLIN et al., 2003; SKAKUN; WULDER;
o dos pontos invariantes composto pelos seguintes FRANKLIN, 2003); (b) anlise de vetor de mudana
mtodos: (a) medidas espectrais nas imagens temporais (CARVALHO JNIOR et al., 2011; JOHNSON; KA-
originais ou nas componentes cannicas; (b) densida- SISCHKE, 1998); (c) mistura espectral (ADAMS et al.,
de do diagrama de disperso; e (c) regresso robusta. 1995); e (d) diversas transformaes lineares, como a
O presente mtodo est presente no programa Ablio. anlise de componentes principais (BYRNE et al., 1980;
FUNG e LEDREW, 1987), anlise de correspondncia
3.2 DETECO DE MUDANA (CAKIR et al., 2006), anlise cannica (NIELSEN; CON-
RADSEN; SIMPSON, 1998) e Tasseled-Cap (HEALEY
Diferentes mtodos foram propostos para a de- et al., 2005). Os mtodos de pr-classificao, apesar
teco de mudana a partir de imagens de sensoriamen- de serem efetivos na localizao das mudanas, muitas
to remoto, havendo importantes revises bibliogrficas vezes so difceis de precisar a natureza da mudana,
sobre o tema (COPPIN et al., 2001; HALL; HAY, 2003; necessitando de outra etapa de classificao.
LAMBIN, 1999; LU et al., 2003; SINGH, 1989; TEWKES- Dessa forma, o mtodo de ps-classificao o
BURY et al., 2015). mais amplamente usado nos estudos de deteco de mu-
Os algoritmos de deteco de mudana so cons- dana em ambientes urbanos, por ser efetivo na descri-
titudos de duas etapas de processamento: (a) classifica- o da magnitude, localizao e natureza das alteraes
o; e (b) deteco de mudana. Uma classificao dos ocorridas (HARDIN; JACKSON; OTTERSTROM, 2007).
mtodos de deteco de mudana considera se a eta- As principais vantagens do mtodo de ps-classificao
pa de deteco de mudana precede ou aps a etapa so: (a) a independncia no processo de classificao das
de classificao, sendo denominados de (YUAN et al., imagens temporais compensa as variaes das condi-

91 Revista do TCU 137


O potencial de dados de sensoriamento remoto na fiscalizao de obras pblicas // Artigos

es atmosfricas, mudanas fenolgicas e umidade de a fim de reforar a relao entre o projeto original da
solo; (b) o processo de atualizao dos dados simples, obra e a magnitude de mudana detectada na imagem.
beneficiando o monitoramento; (c) possibilita comparar O avano de modelos especialistas para a deteco de
dados de sensores com diferentes tipos de resolues; e mudana de forma automatizada ou semiautomatiza-
(d) permite individualizar as diferentes categorias de mu- da das obras pblicas permitir estabelecer um sistema
dana, no ficando restrito em apenas realar as feies de alerta com priorizao de vistorias em campo. Nes-
de mudanas (COPPIN et al., 2001; MENKE et al., 2009). se propsito, deve-se ter um esforo de pesquisa com-
Em contraposio, as duas principais desvantagens desse putacional para o desenvolvimento de um conjunto de
mtodo so: (a) normalmente no completamente au- tcnicas de deteco de padres que permita aperfeioar
tomtico, o que torna o mtodo moroso; e (b) a preciso o gerenciamento das fases da obra reduzindo as incer-
da deteco das mudanas depende da acurcia da classi- tezas. Esse arsenal tecnolgico adequado aos diferentes
ficao em cada tempo, o que pode facilitar a propagao alvos permitir estabelecer estratgias para coibir a ao
de erros (YUAN et al., 2005; MENKE et al., 2009). de possveis fraudes ou atrasos no cronograma.
Conforme Silva et al. (2012), a classificao dire- O fator-chave para obter um mapeamento bem-
ta sobre as diversas bandas espectro-temporais no se -sucedido das obras de engenharia utilizar as imagens
enquadra nos mtodos de ps-classificao e pr-clas- de alta resoluo (espectral, espacial e temporal) e o
sificao, uma vez que as etapas de classificao e de MDE de forma integrada com a resposta pretendida des-
deteco de mudana so efetuadas sincronicamente.. crita pelo projeto executivo, constando todos os fatores
Nesse tipo de classificao so usados normalmente a especficos atividade de execuo. Diferentemente de
anlise de grupos (WEISMILLER et al., 1977) e as redes outros estudos de sensoriamento remoto em reas ur-
neurais artificiais (DAI; KORRAM, 1999). banas, no presente caso tem-se previamente a locao
espacial e as mudanas pretendidas, o que permite uma
4. CONCLUSO nova abordagem para o desenvolvimento de tcnicas
automatizadas considerando um modelo prvio.
No presente trabalho foram revistas as principais
potencialidades e desafios para o emprego do sensoria- REFERNCIAS
mento remoto na fiscalizao de obras dentro das ativida-
des do TCU, focando os seguintes aspectos: (a) qualidade ABADE, N. A. et al. Comparative Analysis of MODIS Time-Series
dos atributos da imagem; (b) etapas de processamento Classification Using Support Vector Machines and Methods
digital de imagens; e (c) possveis adequaes e esforos Based upon Distance and Similarity Measures in the Brazilian
necessrios para quantificar e entender as etapas das Cerrado-Caatinga Boundary. Remote Sensing, [S.l.], v. 7, n. 9, p.
obras pblicas. A fiscalizao de obras pblicas a partir 12160-12191, 2015.
de sensoriamento remoto um processo complexo, com
algum grau de interferncias entre classes e uma forte
componente de mudanas espaotemporais. Apenas uma
representao contnua no tempo dos elementos da obra
permite uma anlise e fiscalizao precisas. Para esse pro-
psito, medies repetitivas dos componentes espectrais
e espaciais da superfcie da Terra devem ser obtidas pre-
ferencialmente em alta resoluo. Cada atributo fornece
um tipo especfico de informaes sobre a obra, devendo
ser combinados para obter uma descrio detalhada dos
processos superficiais. Diferentes modelos de deteco
de mudanas devem ser testados, considerando as con-
dies de circunvizinhana e de ambientes.
A fiscalizao e o monitoramento a partir de tc-
nicas de geoprocessamento e sensoriamento remoto
permitem monitorar diferentes obras simultaneamente,
praticamente em tempo real. Essa nova abordagem ne-
cessita de um conjunto de investigaes metodolgicas,

Setembro/Dezembro 2016 92
Artigos

ADAMS, J. B. et al. Classification of Multispectral Images Based on CARVALHO JNIOR, A. O. et al. A New Approach to Change Vector
Fractions of Endmembers: Application to Land-Cover Change Analysis Using Distance and Similarity Measures. Remote Sensing,
in the Brazilian Amazon. Remote Sensing of Environment, [S.l.], [S.l.], v. 3, p. 2473-2493, 2011.
v. 52, p. 137-154, 1995.
______. Anlise de imagens hiperespectrais pelo mtodo
AIRES, F. et al. Characterization and Space-Time Downscaling of Multiple Endmember Spectral Mixture Analysis (MESMA) em
the Inundation Extent over the Inner Niger Delta Using GIEMS and depsito supergnico de nquel. Brazilian Journal of Geology, So
MODIS Data. Journal of Hydrometeorology, Washington, DC, v. Paulo, v. 33, n. 1, p. 63-74, 2003.
15, n. 1, p. 171-192, 2014.
______. Classificao de padres de savana usando assinaturas
ALMUTAIRI, A.; WARNER, T. A. Change Detection Accuracy and temporais NDVI do sensor MODIS no Parque Nacional Chapada dos
Image Properties: A Study Using Simulated Data. Remote Sensing, Veadeiros. Revista Brasileira de Geofsica, [S.l.], v. 26, n. 4, p. 505-517, 2008.
[S.l.], v. 2, p. 1508-1529, 2010.
______. Standardized Time-Series And Interannual Phenological
BALTSAVIAS, E. P. Airborne Laser Scanning: Basic Relations and Deviation: New Techniques for Burned-Area Detection Using
Formulas. ISPRS Journal of Photogrammetry and Remote Sensing, Long-Term MODIS-NBR Dataset. Remote Sensing, [S.l.], v. 7, n. 6,
[S.l.], v. 54, p. 199-214, 1999. p. 6950-6985, 2015.

BAUGH, C. A. et al. SRTM Vegetation Removal and Hydrodynamic ______. Radiometric Normalization of Temporal Images
Modeling Accuracy. Water Resource Research, Washington, DC, Combining Automatic Detection of Pseudo-Invariant Features
v. 49, p. 5276-5289, 2013. from the Distance and Similarity Spectral Measures, Density
Scatterplot Analysis, and Robust Regression. Remote Sensing,
BEN-DOR, E.; LEVIN, N.; SAARONI, H. A Spectral Based Recognition [S.l.], v. 5, n. 6, p. 2763-2794, 2013.
of the Urban Environment Using the Visible and Near-Infrared
Spectral Region (0.4-1.1 m): A Case Study Over Tel-Aviv. CAVALLI, R. M. et al. Hyperspectral Sensor Data Capability for
International Journal of Remote Sensing, Londres, v. 22, n. 11, p. Retrieving Complex Urban Land Cover in Comparison with
2193-2218, 2001. Multispectral Data: Venice City Case Study (Italy). Sensors, [S.l.], v.
8, n. 5, p. 3299-3320, 2008.
BLASCHKE, T. Object Based Image Analysis for Remote Sensing.
ISPRS Journal of Photogrammetry and Remote Sensing, [S.l.], v. CHEN, X.; VIERLING, L.; DEERING, D. A Simple and Effective
65, n. 1, p. 2-16, 2010. Radiometric Correction Method to Improve Landscape Change
Detection across Sensors and across Time. Remote Sensing of
BRASIL. Tribunal de Contas da Unio. Fiscobras 2015. 2015. Environment, [S.l.], v. 98, p. 63-79, 2005.
Disponvel em: <http://portal.tcu.gov.br/lumis/portal/file/
fileDownload.jsp?fileId=8A8182A250C885960150CD7694B146 CLARK, R. N. et al. USGS Digital Spectral Library Splib06a. US
CC&inline=1>. Acesso em: 20 out. 2016. Geological Survey, Digital Data Series, [S.l.], n. 231, 2007.

BYRNE, G. F.; CRAPPER, P. F.; MAYO, K. K. Monitoring Land Cover COPPIN, P. et al. Operational Monitoring of Green Biomass Change
Change by Principal Component Analysis of Multitemporal Landsat for Forest Management. Photogrammetric Engineering and
Data. Remote Sensing of Environment, [S.l.], v. 10, p. 175-184, 1980. Remote Sensing, Bethesda, v. 67, p. 603-611, 2001.

CAKIR, H. I.; KHORRAM, S.; NELSON, S. A. C. Correspondence COPPIN, P. R.; BAUER, M. E. Digital Change Detection in Forest
Analysis for Detecting Land Cover Change. Remote Sensing of Ecosystems with Remote Sensing Imagery. Remote Sensing
Environment, [S.l.], v. 102, n. 3-4, p. 306-317, 2006. Reviews, Londres, v. 13, n. 3-4, p. 207-234, 1996.

CANTY, M. J.; NIELSEN, A. A.; SCHMIDT, M. Automatic Radiometric COUTO JNIOR, A. F.; CARVALHO JNIOR, O. A.; MARTINS, E. S.
Normalization of Multitemporal Satellite Imagery. Remote Sries temporais MODIS aplicadas em sucesso de culturas de
Sensing of Environment, [S.l.], v. 91, p. 441-451, 2004. soja (Glycine max (L.) Merrill) e milho (Zeamays L.) em sistema de
plantio direto. Revista Brasileira de Cartografia, Rio de Janeiro, v.
64, n. 3, p. 405-418, 2012.

93 Revista do TCU 137


O potencial de dados de sensoriamento remoto na fiscalizao de obras pblicas // Artigos

COWEN, D. J. et al.The Design and Implementation of an Integrated FRANKLIN, S. E. et al. Mountain Pine Beetle Red-Attack Forest
Gis For Environmental Applications. Photogrammetric Engineering Damage Classification Using Stratified Landsat TM Data in British
and Remote Sensing, Bethesda, v. 61, p. 1393-1404, 1995. Columbia, Canada. Photogrammetric Engineering and Remote
Sensing, Bethesda, v. 69, n. 3 p. 283-288, 2003.
DAI, X. L.; KHORRAM, S. Remotely Sensed Change Detection Based
on Artificial Neural Networks. Photogrammetric Engineering and FUNG, T.; LE DREW, E. Application of Principal Components
Remote Sensing, Bethesda, v. 65, n. 10, p. 1187-1194, 1999. Analysis to Change Detection. Photogrammetric Engineering
and Remote Sensing, Bethesda, v. 53, n. 12, p. 1649-1658, 1987.
______. The Effects of Image Misregistration on the Accuracy
of Remotely Sensed Change Detection. IEEE Transactions on GREEN, R. O. et al. Imaging Spectroscopy and the Airborne Visible/
Geoscience and Remote Sensing, [S.l.], v. 36, p. 1566-1577, 1998. Infrared Imaging Spectrometer (AVIRIS). Remote Sensing of
Environment, [S.l.], v. 65, p. 227-248, 1998.
CARVALHO JNIOR, O. A., HERMUCHE, P. M., GUIMARES, R. F.
Identificao regional da floresta estacional decidual na bacia do HALL, O.; HAY, G. J. A Multiscale Object-Specific Approach to
Rio Paran a partir da anlise multitemporal de imagens MODIS. Digital Change Detection. International Journal of Applied Earth
Revista Brasileira de Geofsica, [S.l.], v. 24, n. 3, p. 319-332, 2006. Observation and Geoinformation, [S.l.], v. 4, p. 311-327, 2003.

DEMARCHI, L. et al. Multiple Endmember Unmixing of CHRIS/ HARDIN, P. J.; JACKSON, M. W.; OTTERSTROM, S. M. Mapping,
Proba Imagery for Mapping impervious Surfaces in Urban and Measuring, and Modeling Urban Growth. In: JENSEN, R. R.;
Suburban Environments. IEEE Transactions on Geoscience and GATRELL J. D.; MCLEAN D. (Org.). Geo-Spatial Technologies in
Remote Sensing, [S.l.], v. 50, n. 9, p. 3409-3424, 2012. Urban Environments: Policy, Practice and Pixels. 2. ed. Heidelberg:
Springer-Verlag, 2007. p. 141-176.
DORREN, L.; MAIER, B.; SEIJMONSBERGEN, A. Improved Landsat-
Based Forest Mapping in Steep Mountainous Terrain Using HEALEY, S. P. et al. Comparison of Tasseled Cap-based Landsat
Object-Based Classification. Forest Ecology and Management, Data Structures for Use in Forest Disturbance Detection. Remote
[S.l.], v. 183, n. 1-3, p. 31-46, 2003. Sensing of Environment, [S.l.], v. 97, n. 3, p. 301-310, 2005.

DU, Y.; TEILLET, P. M.; CIHLAR, J. Radiometric Normalization of HEGAZY, I. R.; KALOOP, M. R. Monitoring Urban Growth and
Multitemporal High-Resolution Satellite Images with Quality Land Use Change Detection with GIS and Remote Sensing
Control for Land Cover Change Detection. Remote Sensing of Techniques in Daqahlia Governorate Egypt. International Journal
Environment, [S.l.], v. 82, p. 123-134, 2002. of Sustainable Built Environment, [S.l.], v. 4, p. 117-124, 2015.

DURUPT, M.; TAILLANDIER, F. Automatic Building Reconstruction HEIDEN, U.; SEGL, K.; KAUFMANN, H. Determination of Robust
from a Digital Elevation Model and Cadastral Data: An Operational Spectral Features for Identification of Urban Surface Materials
Approach. 2006. Disponvel em: <http://www.isprs.org/ in Hyperspectral Remote Sensing Data. Remote Sensing of
proceedings/XXXVI/part3/singlepapers/O_14.pdf>. Acesso em: Environment, [S.l.], v. 111, n. 4, p. 537-552, 2007.
25 nov. 2016.
HEO, J.; FITZHUGH, T. W. A Standardized Radiometric Normalization
ELVIDGE, C. D. et al. Relative Radiometric Normalization of Landsat Method for Change Detection Using Remotely Sensed Imagery.
Multispectral Scanner (MSS) Data Using an Automatic Scattergram- Photogrammetric Engineering and Remote Sensing, Bethesda,
Controlled Regression. Photogrammetric Engineering and Remote v. 66, n. 2, p. 173-181, 2000.
Sensing, Bethesda, v. 61, p. 1255-1260, 1995.
HEROLD, M. et al. Spectrometry for Urban Area Remote Sensing
FRANKE, J. et al. Hierarchical Multiple Endmember Spectral Development and Analysis of a Spectral Library from 350 to
Mixture Analysis (MESMA) of Hyperspectral Imagery for Urban 2400 nm. Remote Sensing of Environment, [S.l.], v. 91, n. 3-4, p.
Environments. Remote Sensing of Environment, [S.l.], v. 113, n. 8, 304-319, 2004.
p. 1712-1723, 2009.
HOBI, M. L.; GINZLER, C. Accuracy Assessment of Digital Surface
Models Based on WorldView-2 and ADS80 Stereo Remote
Sensing Data. Sensors, [S.l.], v. 12, p. 6347-6368, 2012.

Setembro/Dezembro 2016 94
Artigos

JARIHANI, A. A. et al. Satellite-Derived Digital Elevation Model MENG, X.; CURRIT, N.; ZHAO, K. Ground Filtering Algorithms for
(DEM) Selection, Preparation and Correction for Hydrodynamic Airborne LiDAR Data: A Review of Critical Issues. Remote Sensing,
Modelling in Large, Low-Gradient and Data-Sparse Catchments. [S.l.], v. 2, p. 833-860, 2010.
Journal of Hydrology, [S.l.], v. 524, p. 489-506, 2015.
MENKE, A. B. et al. Anlise das mudanas do uso agrcola da terra
JAT, M. K.; GARG, P. K.; KHARE, D. Monitoring and Modelling of Urban a partir de dados de sensoriamento remoto multitemporal no
Sprawl Using Remote Sensing and GIS Techniques. International municpio de Luis Eduardo Magalhes (BA-Brasil). Sociedade &
Journal of Applied Earth Observation and Geoinformation, [S.l.], Natureza, Uberlndia, v. 21, n. 3, p. 315-326, 2009.
v. 10, n. 1, p. 26-43, 2008.
MIRANDA, A. C. O.; MATOS; C. R. Potencial uso do BIM na
JENSEN, J. R. et al. An Evaluation of Coastwatch Change Detection fiscalizao de obras pblicas. Revista do Tribunal de Contas da
Protocol in South Carolina. Photogrammetric Engineering and Unio, Braslia, DF, v. 133, p. 22-31, 2015.
Remote Sensing, Bethesda, v. 59, n. 4, p. 519-525, 1993.
MUSA, Z. N.; POPESCU, I.; MYNETT, A. A Review of Applications of
JENSEN, J. R.; COWEN, D. C. Remote Sensing of Urban/Suburban Satellite SAR, Optical, Altimetry and DEM Data for Surface Water
Infrastructure and Socio-Economic Attributes. Photogrammetric Modelling, Mapping and Parameter Estimation. Hydrology and
Engineering and Remote Sensing, Bethesda, v. 65, p. 611-622, 1999. Earth System Sciences, [S.l.], v. 19, p. 3755-3769, 2015.

JOHNSON, R. D.; KASISCHKE, E. S. Change Vector Analysis: A MYINT, S. et al. Per-Pixel vs. Object-Based Classification of Urban
Technique for the Multispectral Monitoring of Land Cover and Land Cover Extraction Using High Spatial Resolution Imagery.
Condition. International Journal of Remote Sensing, Londres, v. Remote Sensing of Environment, [S.l.], v. 115, n. 5, p. 1145-1161,
19, p. 3, n. 411-426, 1998. 2011.

KIM, M.; MADDEN, M.; XU, B. GEOBIA Vegetation Mapping in Great NIELSEN, A. A.; CONRADSEN, K.; SIMPSON, J. J. Multivariate
Smoky Mountains National Park with Spectral and Non-Spectral Alteration Detection (MAD) and MAF Postprocessing in
Ancillary Information. Photogrammetric Engineering and Remote Multispectral, Bitemporal Image Data: New Approaches to
Sensing, Bethesda, v. 76, n. 2, p. 137-149, 2010. Change Detection Studies. Remote Sensing of Environment,
[S.l.], v. 64, p. 1-19, 1998.
KIM, M.; MADDEN, M.; WARNER, T. Forest Type Mapping Using
Object-Specific Texture Measures from Multispectral IKONOS OLIVEIRA, S. N et al. Deteco de mudana do uso e cobertura da
Imagery: Segmentation Quality and Image Classification Issues. terra usando o mtodo de ps-classificao na fronteira agrcola
Photogrammetric Engineering and Remote Sensing, Bethesda, do oeste da Bahia sobre o Grupo Urucuia durante o perodo
v. 75, n. 7, p. 819-830, 2009. 1988-2011. Revista Brasileira de Cartografia, Rio de Janeiro, v. 66,
n. 5, p. 1157-1176, 2014.
KIM, Z. W.; NEVATIA, R. Automatic Description of Complex Buildings
from Multiple Images. Computer Vision Image Understanding, v. PHINN, S. R. et al. Monitoring the Composition of Urban
96, p. 60-95, 2004. Environments Based on the Vegetation-Impervious Surface-Soil
(VIS) Model by Subpixel Analysis Techniques. International Journal
LAMBIN, E. F. Monitoring Forest Degradation in Tropical Regions of Remote Sensing, Londres, v. 23, n. 20, p. 4131-4153, 2002.
by Remote Sensing: Some Methodological Issues. Global Ecology
and Biogeography, [S.l.], v. 8, n. 3-4, p. 191-198, 1999. POLI, D.; TOUTIN, T. Review of Developments in Geometric
Modelling for High-Resolution Satellite Pushbroom Sensors.
LIU, D.; XIA, F. Assessing Object-Based Classification: Advantages Photogrammetric Record, [S.l.], v. 27, p. 58-73, 2012.
and Limitations. Remote Sensing Letters, Melbourne, v. 1, n. 4, v.
187-194, 2010. PUENTE, I. et al. Review of Mobile Mapping and Surveying
Technologies. Measurement: Journal of the International
LU, D. et al. Change Detection Techniques. International Journal of Measurement Confederation, [S.l.], v. 46, n. 7, p. 2127-2145, 2013.
Remote Sensing, Londres, v. 25, n. 12, p. 2365-2407, 2003.

95 Revista do TCU 137


RAO, N. R.; GARG, P. K.; GHOSH, S. K. Development of an Agricultural TOWNSHEND, J. R. G. et al. The Impact of Misregistration on
Crops Spectral Library and Classification of Crops at Cultivar Level Change Detection. IEEE Transactions on Geoscience and Remote
Using Hyperspectral Data. Precision Agriculture, [S.l.], v. 8, n. 4-5, Sensing, [S.l.], v. 30, n. 5, p. 1054-1060, 1992.
p. 173-185, 2007.
TRIAS-SANZ, R., STAMON, G., LOUCHET, J. Using Colour, Texture,
SAKAMOTO, T. et al. A Crop Phenology Detection Method Using and Hierarchical Segmentation for High-Resolution Remote
Time-Series MODIS Data. Remote sensing of environment, [S.l.], Sensing. ISPRS Journal of Photogrammetry and Remote Sensing,
v. 96, n. 3, p. 366-374, 2005. [S.l.], v. 63, n. 2, p. 156-168, 2008.

SINGH, A. Digital Change Detection Techniques Using Remotely- VITAL, A. L. F. et al. Fiscobras: uma obra em construo. Revista do
Sensed Data. International Journal of Remote Sensing, Londres, Tribunal de Contas da Unio, Braslia, DF, v. 133, p. 32-39, 2015.
v. 10, p. 989-1003, 1989.
WEISMILLER, R. A. et al. Change Detection in Coastal Zone
SILVA, N. C. et al. Change Detection Software Using Self-Organizing Environments. Photogrammetric Engineering and Remote
Feature Maps. Revista Brasileira de Geofsica, [S.l.], v. 30, n. 4, p. 505- Sensing, Bethesda, v. 43, p. 1533-1539, 1977.
518, 2012.
WENTZ, E. A. et al. Supporting Global Environmental Change
SKAKUN, R. S.; WULDER, M. A.; FRANKLIN, S. E. Sensitivity of the Research: A Review of Trends and Knowledge Gaps in Urban
Thematic Mapper Enhanced Wetness Difference Index to Detect Remote Sensing. Remote Sensing, [S.l.], v. 6, n. 5, p. 3879-3905, 2014.
Mountain Pine Beetle Red-Attack Damage. Remote Sensing of
Environment, [S.l.], v. 86, p. 433-443, 2003. WU, C.; MURRAY, T. A. Estimating Impervious Surface Distribution
by Spectral Mixture Analysis. Remote Sensing of Environment,
SMALL, C. High Resolution Spectral Mixture Analysis of Urban [S.l.], v. 84, n. 4, p. 493-505, 2003.
Reflectance. Remote Sensing of Environment, [S.l.], v. 88, p. 170-
186, 2003. YADAV, P. K.; KAPOOR, M.; SARMA, K. Land Use Land Cover
Mapping, Change Detection and Conflict Analysis of Nagzira-
SONG, C. et al. Classification and Change Detection Using Landsat Navegaon Corridor, Central India Using Geospatial Technology.
TM Data: When and How to Correct Atmospheric Effects? Remote International Journal of Remote Sensing and GIS, Deli, v. 1, n. 2,
Sensing of Environment, [S.l.], v. 75, p. 230244, 2001. p. 90-98, 2012.

SOUZA, I. V. N.; BATISTA, H. M. Estudo dos benefcios econmicos YU, Q. et al. Object-Based Detailed Vegetation Classification with
gerados pelas fiscalizaes de obras pblicas, realizadas pelo Airborne High Spatial Resolution Remote Sensing Imagery.
Tribunal de Contas da Unio, no estado do Rio Grande do Norte, Photogrammetric Engineering and Remote Sensing, Bethesda,
no perodo de 2011 e 2012. 2013. 67 f. (Trabalho de Concluso de v. 72, n. 7, p. 799-811, 2006.
Curso) Departamento de Cincias Contbeis da Universidade
Federal do Rio Grande do Norte, Natal, 2013. YUAN, F. et al. Land Cover Classification and Change Analysis of
the Twin Cities (Minnesota) Metropolitan Area by Multitemporal
SUN, C. et al. Quantifying Different Types of Urban Growth and the Landsat Remote Sensing. Remote Sensing of Environment, [S.l.],
Change Dynamic in Guangzhou Using Multi-Temporal Remote v. 98, n. 2, p. 317-328, 2005.
Sensing Data. International Journal of Applied Earth Observation
and Geoinformation, [S.l.], v. 21, p. 409-417, 2013. ZOMER, R. J.; TRABUCCO, A.; USTIN, S. L. Building Spectral Libraries
for Wetlands Land Cover Classification and Hyperspectral Remote
TEWKESBURY, A. P. et al. A Critical Synthesis of Remotely Sensed Sensing. Journal of Environmental Management, [S.l.], v. 90, n. 7,
Optical Image Change Detection Techniques. Remote Sensing p. 2170-2177, 2009.
of Environment, [S.l.], v. 160, p. 1-14, 2015.
ZULLO JNIOR, J. Correo atmosfrica de imagens de satlite e
THOMAS, N.; HENDRIX, C.; CONGALTON, R. G. A Comparison of aplicaes. 1994. 191 p. Tese (Doutorado em Engenharia Eltrica)
Urban Mapping Methods Using High-Resolution Digital Imagery. Universidade Estadual de Campinas, Campinas, 1994.
Photogrammetric Engineering and Remote Sensing, Bethesda,
v. 69, n. 9, p. 963-972, 2003.

Setembro/Dezembro 2016 96
Artigos

Implementao de um
geocatlogo para auxlio na
localizao e recuperao de
dados geogrficos abertos

Drausio Gomes dos Santos  RESUMO


servidor do Tribunal de Contas
da Unio, mestre em Computao Este artigo trata da construo de um geo-
Aplicada pela Universidade de catlogo que utiliza a semntica e ontologias para
Braslia, especialista em Gesto auxlio no processo de descoberta de recursos geo-
da Tecnologia da Informao grficos em servios de uma infraestrutura aberta
pelo Cin/UFPE, tecnlogo de dados espaciais. Sua arquitetura incorpora um
em Processamento de Dados banco de dados no relacional orientado a grafos e
pela FATEC/SP e bacharel passvel de implementao em ambiente de nuvem.
em Geografia pela USP. Para sua concepo foi utilizada a metodologia de
desenvolvimento de sistemas SERVUS, especializa-
da em arquitetura orientada a servios geoespaciais.

Alexandre Zaghetto  Palavras-chave: Engenharia de Software.


mestre e doutor em Engenharia Geocatlogo. SERVUS. IDE. Semntica. Dados
Eltrica pela Universidade de abertos.
Braslia (UnB), possui graduao em
Engenharia Eltrica, com nfase 1. INTRODUO
em Eletrnica, pela Universidade
Federal do Rio de Janeiro, alm Tem sido um desafio para os rgos da ad-
de professor adjunto no Dept. de ministrao pblica obter uma viso espacial do
Cincia da Computao da UnB resultado das aes governamentais de forma sim-
e lder do Grupo de Pesquisa em plificada e atualizada, uma vez que os dados so
Sistemas Biomtricos (BiTGroup). descentralizados, produzidos por fontes variadas e
em momentos diferentes. O governo tem tomado
algumas medidas na direo da padronizao, oti-
mizao de recursos e integrao de dados, sendo
uma delas a criao da Infraestrutura Nacional de
Dados Espaciais do Brasil (INDE-BR).

97 Revista do TCU 137


Implementao de um geocatlogo para auxlio na localizao e recuperao de dados geogrficos abertos // Artigos

retranca imagem

ctrl + Shift + click para liberar


retranca

A INDE-BR consiste em uma iniciativa de Consortium (OGC). Alguns desses padres definem
criao de uma arquitetura para disseminao e re- o funcionamento dos geosservios, que permitem a
gramento do uso de dados geogrficos no mbito obteno de mapas cartogrficos, mapas temticos,
da administrao pblica. Cabe ressaltar um dos dados geogrficos e metadados.
objetivos definidos na sua concepo, o de Um dos componentes essenciais numa ar-
quitetura de IDE o catlogo de servios. A meto-
evitar a duplicidade de aes e o desperdcio de dologia SERVUS de desenvolvimento de sistemas
recursos na obteno de dados aeroespaciais pelos (USLNDER, 2010), feita especialmente para tra-
rgos da administrao pblica, por meio da tar do uso e composio de servios geoespaciais,
divulgao dos metadados relativos a esses dados prope a utilizao de um geocatlogo semntico
disponveis nas entidades e nos rgos pblicos das para auxlio na localizao de recursos geogrficos
esferas federal, estadual, distrital e municipal (BRASIL, em rede.
2008). Para estudar esse aspecto, este documento foi
dividido da seguinte forma: na Seo 2 so apre-
Camboim (2013) ressalta a iniciativa gover- sentados alguns trabalhos correlatos; na Seo 3
namental de criao da Infraestrutura Nacional de apresentada a fundamentao terica, tratando
Dados Abertos (INDA) e do Portal Brasileiro de Da- dos temas IDE e metodologia SERVUS; na Seo 4
dos Abertos como uma estratgia de adoo de Da- apresentado o modelo proposto, detalhes do ge-
dos Interligados Abertos (Linked Open Data). Esse ocatlogo e um exemplo de utilizao com a me-
autor prope uma arquitetura capaz de tornar os todologia SERVUS e, por fim, na Seo 5 temos as
dados da INDE-BR disponveis na INDA de forma concluses.
integrada. Essa proposta de arquitetura destaca-se
pelo uso de camadas semnticas e ontologias, fa- 2. TRABALHOS CORRELATOS
zendo uma juno de tcnicas da web semntica
com dados geoespaciais, ingressando no campo da Andrade e Baptista (2011) trilharam um cami-
geossemntica. nho que inclua busca semntica, listagem de gran-
As arquiteturas das IDE atuais so, via de de quantidade de informaes oriundas de fontes
regra, orientadas a servio e adotam os padres diversas, estabelecimento de mtricas e gerao
tecnolgicos estabelecidos pela Open Geospatial de um ranking de recursos disponibilizados numa

Setembro/Dezembro 2016 98
Artigos

infraestrutura de dados espaciais. Os autores parti- anlise dos dados geogrficos, de uma forma pa-
ram do pressuposto de que o uso de ontologias seria dro e interopervel. Tambm consideram a ne-
o caminho para tornar mais precisas as buscas e fa- cessidade de que esses dados estejam disponveis
cilitar o processo de automatizao. Como contri- em rede, por meio de um conjunto de sistemas que
buies, tivemos o estabelecimento de uma mtrica utilizem protocolos e interfaces padres, propician-
combinada e a construo de uma rede semntica. do a criao de aplicaes que possam ser vistas
Daltio e Carvalho (2012) propuseram a cons- pelo usurio como um nico sistema. IDE pode ser
truo de um framework para a recuperao semntica classificada como uma estrutura de componentes
de dados espaciais. O framework era baseado em um tecnolgicos, geogrficos, sociais e polticos con-
processo de anotao semntica dos recursos geogr- forme ilustrado na Figura 1.
ficos e na utilizao de um servio de gerenciamento O componente tecnolgico representado
de ontologias. Cabe ressaltar neste trabalho a impor- por uma arquitetura baseada em padres de in-
tncia dada ao processo de seleo das ontologias. teroperabilidade e capaz de compartilhar dados e
Gimenez, Tanaka e Baio (2013) apresentam informaes geogrficas. As linguagens de marca-
uma proposta de integrao semntica para a INDE- o XML e GML tm um papel fundamental nesse
-BR usando geo-ontologias de domnio incorpora- componente. O componente social representado
das em camadas semnticas atuando sobre as IDEs. por um conjunto de atores, dentre eles, produtores
de dados, provedores de servios, usurios, desen-
3. FUNDAMENTAO TERICA volvedores de software e responsveis por padres
e normas, alm de uma grande comunidade forma-
3.1 INFRAESTRUTURA DE DADOS da por empresas privadas, governo, universidades
ESPACIAIS (IDE) e a sociedade em geral. O componente geogrfi-
co representado pelos dados, seus metadados e
Bernab-Poveda e Lpez Vzquez (2012, p. os geosservios. O componente poltico repre-
57-59) conceituam Infraestrutura de Dados Espa- sentado pelas pessoas e pelo rgo responsvel
ciais (IDE) como uma infraestrutura necessria para por estabelecer o marco regulatrio e as regras de
o acesso, compartilhamento, troca, combinao e funcionamento.

Figura 1:
Componentes de uma IDE

INFRAESTRUTURA DE DADOS ESPACIAIS

POLTICO TECNOLGICO

LINGUAGENS
RGO MARCO NORMAS E PADRES
PADRES DE
GESTOR LEGAL DE
MARCAO
INTEROPERABILIDADE
(XML-GML)

GEOGRFICO SOCIAL

ATORES
DADOS METADADOS (PRODUTORES, PROVEDORES,
DESENVOLVEDORES, COLABORADORES,
INTERMEDIRIOS E USURIOS FINAIS)

SERVIOS COMUNIDADE
(EMPRESAS PRIVADAS,UNIVERSIDADES,
ADMINISTRAO PBLICA, PARTICULARES)

99 Revista do TCU 137


Implementao de um geocatlogo para auxlio na localizao e recuperao de dados geogrficos abertos // Artigos

OGC Web Services Common Standard um pa- 3.2 METODOLOGIA DE


dro tecnolgico que prope uma interface comum DESENVOLVIMENTO SERVUS
para um conjunto de geosservios: Web Map Service
(WMS), Web Feature Service (WFS) e Web Coverage A sigla SERVUS oriunda de dois termos da
Service (WCS). Nessa proposta busca-se padronizar engenharia de software: servio (SERVice) e caso
as formas de acesso, operaes, parmetros obriga- de uso (USe case). O problema central que a meto-
trios e opcionais, alm de estruturas de dados, a dologia se prope a resolver considerando-se um
fim de diminuir os esforos de interoperabilidade. conjunto de casos de uso que atendam aos requisitos
Uma das operaes definidas a GetCapabilities de negcio e demandem capacidade de recursos em
que recupera os metadados referentes s capaci- uma rede de servios geoespaciais como descobrir
dades dos geosservios (GREENWOOD; WHITE- e associar recursos requisitados a recursos ofertados,
SIDE, 2010). compondo uma aplicao que supra os requisitos de
WMS consiste num servio que produz ma- qualidade, funcionais e informacionais. Dois outros
pas dinmicos, em que as informaes geogrficas elementos compem esse cenrio: descries semn-
so organizadas em camadas (layers). O servio ticas em uma rede de recursos semnticos e condi-
WFS trabalha com entidades geogrficas com dados es inerentes (side conditions) ao desenvolvimento
discretos ou vetoriais em formato GML, represen- de sistemas ambientais (processos de descoberta de
tando atributos e geometrias. WCS o servio que recursos, uso de padres OGC, combinaes de re-
d suporte a recuperao de dados espaciais como cursos) (USLNDER, 2010).
coberturas. Segundo Uslnder (2010, p. 90), SERVUS
Um catlogo de servio permite a localiza- compreende o projeto de sistemas de informao
o de dados ou servios geogrficos atravs de ambientais como uma atividade iterativa de des-
uma gama de operaes, dentre elas a operao coberta e associao: capacidades disponveis so
GetRecords que recupera um conjunto de registros descobertas e associadas a requisitos do usurio
de metadados (OGC, 2016). formulados como casos de uso.

Figura 2:
Hierarquia de modelos SERVUS

AMBIENTE DE NEGCIO SERVUS BIERBESTEIN E


OUTROS 2006
EMPRESARIAL

MODELOS DE
CAMADA

CASOS DE USO DOMNIO


CAMADA DE PROCESSO

REQUISITOS
MODELOS DE
PROCESSO E
APLICAO CASO DE USO

USO DE CAPACIDADES
MODELOS DE
CAMADA DE SERVIO

PROJETO

SERVIOS SERVIOS SERVIOS


MODELOS DE
REFERNCIA

SERVIOS
SERVIOS

SERVIOS
REDE DE GEOSSERVIOS

Fonte: Adaptado de Uslnder (2010, p. 92)

Setembro/Dezembro 2016 100


Artigos

A metodologia composta por uma lingua- Facility (MOF). As principais metaclasses so: fei-
gem de modelagem, um processo de desenvolvi- o (feature), interface, servio e recurso. O modelo
mento e uma arquitetura de referncia. Durante o conceitual composto por trs subconjuntos de
processo de desenvolvimento so criados artefatos metaclasses, o primeiro est associado viso de
tais como: um modelo de domnio, um modelo de servio, o segundo viso de informao e o tercei-
processos/casos de uso e um modelo de projeto. O ro viso de recurso. O modelo de projeto pode ser
modelo de projeto o principal deles e expressa os visto como uma composio de trs modelos: o de
requisitos e as capacidades sob a forma de recur- requisitos (REQs), o de capacidades (CAPs) e o de
sos. Os modelos gerados so baseados nas cama- mapeamento entre os dois primeiros (REQ2CAP).
das de abstrao propostas por Bieberstein (2006). A Figura 3 apresenta um quadro geral dos modelos
A Figura 2 exibe o mapeamento entre requisitos e e atividades da etapa de projeto.
capacidades, os modelos produzidos e a relao Segue a seguir uma descrio das principais
com as camadas de abstrao. atividades do processo de desenvolvimento.
O modelo de domnio da metodologia SER-
VUS representa o domnio temtico do problema a. Publishing: atividade, manual ou automa-
a ser resolvido. Ele formalmente define a parte do tizada, de busca de capacidades na rede de
mundo que compreende o universo de discurso en- servios geoespaciais e de incorporao ao
tre o usurio e o projetista do sistema, isto , com- modelo de capacidades. As capacidades so
preende o conhecimento compartilhado acerca do traduzidas para recursos ofertados, ou seja,
domnio da aplicao. Tipicamente esses conheci- disponveis na rede de geosservios;
mentos compartilhados so representados pela es-
pecificao de uma ontologia (USLNDER, 2010). b. Rephrasing: atividade responsvel por tra-
O modelo de referncia composto por um duzir os requisitos, de forma a extrair um
framework arquitetural, responsvel pelas orienta- conjunto de recursos necessrios para reali-
es e regras de como especificar o sistema, e por zao dos casos de uso, os recursos podem
um modelo conceitual. O modelo conceitual de ser associados aos conceitos de ontologia e
SERVUS um metamodelo segundo os preceitos em seguida carregados na rede de recursos se-
de Model Driven Architecture (MDA) e Meta-Object mnticos, compondo o modelo de requisitos;

Figura 3: Problema Modelagem


Modelos e atividades de domnio
de projeto

Anlise
Modelo
de domnio

Refere-se ao Descoberta
Requisitos
Feedback Reformulao (Discovery)
generation (Rephrasing)
Modelo de requisitos

Modelo de requisitos
para capacidades
Modelo
de projeto
Modelo de capacidades
Publicao Grounding
(publishing) Combinao
Refere-se ao (Matching)

Capacidades Modelo Modelo de informao


de referncia
Worflow do projeto

Atividade de projeto

Fonte: Adaptado de Uslnder (2010, p. 99)

101 Revista do TCU 137


Implementao de um geocatlogo para auxlio na localizao e recuperao de dados geogrficos abertos // Artigos

c. Discovery: atividade responsvel por sele- que se refere ao suporte metodologia, o catlogo
cionar, no rol de capacidades levantadas na semntico responde pelas atividades de harvesting,
fase publishing, um conjunto que atenda aos que consiste na coleta de metadados dos servios,
recursos solicitados levantados na fase de re- e de publishing, publicao dos recursos disponveis
phrasing, para cada recurso requisitado pode para uma rede de recursos semnticos.
existir um conjunto de recursos ofertados que
atendam s necessidades; 6. MODELO PROPOSTO

d. Matching: atividade responsvel por associar O trabalho foi desenvolvido conforme as


requisitos a capacidades, ou seja, recursos seguintes etapas: reviso de literatura, com a re-
requisitados a recursos ofertados, avalia alizao de estudos sobre IDEs, metodologia de de-
dentre as capacidades candidatas, elencadas senvolvimento SOA, metodologia SERVUS, banco
na etapa de discovery, as mais adequadas de dados orientado a grafos, geocatlogo e busca
aos requisitos. O resultado final dessa eta- semntica; levantamento de requisitos baseado nos
pa o modelo de mapeamento requisitos/ geocatlogos estudados, principalmente no propos-
capacidades; to pela metodologia SERVUS, nas necessidades dos
stakeholders da rea de meio ambiente e na infra-
e. Grounding: atividade que disponibiliza estrutura tecnolgica atual do rgo; definio da
uma nova capacidade na rede de servios arquitetura de alto nvel, considerando-se, dentre
geoespaciais. outros aspectos, fontes de dados, arquiteturas de
IDEs e geosservios da INDE-BR; desenvolvimento
SERVUS prope a criao de um catlogo se- do prottipo, incluindo a definio das linguagens
mntico que compe uma arquitetura de implemen- de desenvolvimentos, dos componentes, das bi-
tao e um ambiente de projeto. O papel do catlogo bliotecas de software e do ambiente de desenvol-
semntico o de se comunicar com os geosservios vimento; implantao com definio do ambiente e
da rede e processar as consultas por recursos. Fun- instalao do prottipo; elaborao de um cenrio
ciona como uma extenso semntica que possibilita de utilizao do geocatlogo tpico de auditoria em
consultas baseadas em ontologias e a avaliao da meio ambiente, validao do prottipo e, por fim,
proximidade semntica dos resultados obtidos. No avaliao do resultados (SANTOS, 2016).

Figura 4:
Arquitetura de
implementao NUVEM

Camada de GRAPHENEDB
Negcio - Amazon
HTTP EC2
REST VM Linux - Ubuntu HTTP Banco de
JSON Servidor de Aplicao REST grafos
Jetty JSON Neo4J
Maquina Virtual Java

Camada de
Apresentao
HTML
Bibliotecas Javascript
(Bootstrap
JQuery, GoogleMaps)

Setembro/Dezembro 2016 102


Artigos

Figura 5:
Modelo de busca do catlogo

Consulta por Parmetros


descrio Filtragem para consulta
temporal
Consulta por
palavras-chave
Filtragem Parmetros
Consulta por espacial para filtragem
classificao em Busca de recursos
ontologias geogrficos

Listagem Ponderao e Rol de recursos


ordenada por Ordenao dos geogrficos
relevncia resultados

A arquitetura escolhida para implementao tional State Transfer) que retorna documentos no
do prottipo do geocatlogo foi a de uma apli- formato JSON (JavaScript Object Notation). A ca-
cao web de trs camadas. A camada de apre- mada de negcio foi hospedada num servio de
sentao foi desenvolvida em HTML5 utilizando nuvem EC2 da Amazon. A camada de persistncia
bibliotecas JavaScript: Bootstrap 3.3.5, jQuery 2.1.0, foi implementada atravs de um banco de dados
Google Maps 3.0 e o componente bootstrap-slider.js. NoSQL de grafos, o Neo4J 2.3.1. A hospedagem
A camada de negcio foi implementada em Java da camada de persistncia foi realizada na pgi-
verso 1.7 e a aplicao empacotada no formato na web GrapheneDB, que implementa os bancos
de web archive WAR. As requisies da camada Neo4J num ambiente de nuvem. A comunicao
de apresentao so feitas pelo protocolo http e entre camada de negcio e camada de persistncia
acessam um servidor padro REST (Representa- tambm ocorre por meio de interfaces REST e no

Tabela 1:
Clculo do ndice de relevncia

Termos de pesquisa Campo com termo localizado Peso Peso Mximo


Descrio: vegetao - (peso 8) Nome - (peso 8) 64 216
Ontologia VCE (termo raiz): vegetao - (peso 6) Descrio - (peso 6) 36 162
Palavra-chave: agrcola - (peso 5) Resumo - (peso 5) 25 135
Peso total 125 513
ndice de relevncia calculado (125/513) 0,24

103 Revista do TCU 137


Implementao de um geocatlogo para auxlio na localizao e recuperao de dados geogrficos abertos // Artigos

formato JSON. A Figura 4 representa a arquitetura mento de gerao do ranking. A Figura 5 apresenta
implementada. o modelo de busca do geocatlogo.
As consultas podem ser realizadas por des- O resultado efetivo de uma busca depende
crio (texto livre), palavras-chave e por termos das da qualidade dos metadados e do valor de negcio
ontologias. Para cada um dos itens anteriores as atribudo a cada campo. Para lidar com esse aspec-
frases ou termos so divididos em tokens que sero to foi elaborado um esquema de ponderao dos
os termos utilizados na busca. Podem ser realiza- campos de pesquisa e dos campos de metadados e
das filtragens por coordenadas geogrficas (filtro o estabelecimento de um ndice de relevncia que
espacial) e por ano (temporal). Para cada par orde- serve de base para o processo de gerao do ranking
nado, composto pelo termo e o campo pesquisado, de resultados. A Tabela 1 apresenta um exemplo de
atribudo um peso que ser a base para o procedi- clculo do ndice de relevncia.

Figura 6:
Tela de busca do
geocatlogo

Figura 7:
reas de proteo
ambiental importadas
para ferramenta QGIS

Setembro/Dezembro 2016 104


Artigos

Os registros dos recursos so recuperados me- dos aspectos da implantao tais como: arquitetura
diante requisies REST para o banco de dados re- e modelo de dados. No que se refere arquitetura,
moto, compostas pelos comandos na linguagem o geocatlogo foi implementado como uma aplica-
Cypher. Os principais tipos de interao so: consul- o web de trs camadas, passvel de implantao
ta a ontologias, criao de relacionamentos entre os em ambiente de nuvem. O modelo de dados foi im-
recursos e gerao do ranking dos recursos geogr- plementado em banco de dados orientado a grafos.
ficos. A Figura 6 exibe o ranking na forma de uma O geocatlogo se mostrou vivel como ferra-
listagem com os links para visualizao do recurso, menta de busca de recursos geogrficos e de apoio
download e visualizao dos metadados. metodologia SERVUS, possibilitando a atuao
Para validao do uso do geocatlogo foram nas etapas de publishing e matching. Podem ser con-
utilizadas as etapas da metodologia SERVUS, utiliza- sideradas como contribuies a utilizao da lin-
mos como base um problema relacionado a uma au- guagem Cypher no manuseio de rede de recursos,
ditoria na rea ambiental, que assim apresentamos: ontologias e metamodelo, de forma integrada, em
como obter os dados necessrios, a nvel brasileiro, banco de dados no relacionais orientado a grafos. O
para o levantamento da localizao de reas de pro- estabelecimento de mecanismos de parametrizao
teo ambiental, utilizando como base os geosser- das consultas, mediante ponderao de parmetros
vios disponveis na rede de infraestrutura de dados e campos de metadados e o estabelecimento de um
espaciais nacional, de instituies e rgos pblicos? ndice de relevncia, so contribuies para o cam-
O resultado final foi a localizao e visuali- po da busca em bases de metadados. Como traba-
zao dessas reas. A Figura 7 apresenta as reas de lhos futuros, podemos considerar a automatizao
proteo ambiental localizadas pelo geocatlogo, do processo harvesting e a integrao com uma in-
cujos dados foram baixados de servios WFS e im- fraestrutura de dados espaciais corporativa, de for-
portados para a ferramenta Quantum GIS. ma que o geocatlogo atue conjuntamente com os
geoportais.
7. CONCLUSO
REFERNCIAS
Este artigo abordou aspectos da implementa-
o de um geocatlogo que possibilita a utilizao ANDRADE, F. G.; BAPTISTA, C. S. Using semantic
de ontologias como parmetros de pesquisa. As con- similarity to improve information discovery in spatial
sultas so realizadas nos metadados de geosservios data infrastructures. Journal of Information and Data
de infraestruturas de dados espaciais. Foram aborda- Management, v. 2, n. 2, p. 181, 2011.

105 Revista do TCU 137


Implementao de um geocatlogo para auxlio na localizao e recuperao de dados geogrficos abertos // Artigos

BERNAB-PO VEDA, M. .; LPEZ-VZQUEZ, C. M. GIMENEZ, P. J. A.; TANAKA, A. K; BAIO, F. Uma proposta


(Eds.). Fundamentos de las infraestructuras de datos de integrao semntica para a Infraestrutura Nacional
espaciales (IDE). Madrid: Universidad Politcnica de d e D a d o s E s p a c i a i s u s a n d o g e o - o n to l o gi a s. I n :
Madrid, 2012. 593p. WORKSHOP DE COMPUTAO APLICADA AO GOVERNO
ELETRNICO ( WCGE), 2013, Joo Pessoa. Anais... Joo
BIEBERSTEIN, N. Service-oriented architecture compass: Pessoa: UFPB, 2013. v. 5. p. 25-32.
business value, planning, and enterprise roadmap.
Indiana: FT Press, 2006. GREENWOOD, J.; WHITESIDE, A. OGC Web Ser vices
Common Standard. 2010. Disponvel em: <http://
BRASIL. Decreto n. 6.666, de 27 de novembro de citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.24
2008. Institui, no mbito do Poder Executivo Federal, 8.6351&rep=rep1&type=pdf>. Acesso em: 22 out. 2016.
a Infraestrutura Nacional de Dados Espaciais INDE,
e d outras providncias. Disponvel em: <http:// OGC. Catalogue Ser vices 3.0 Specification: HT TP
www.planalto.gov.br/ccivil_03/_Ato2007-2010/2008/ Protocol Binding. 2010. Disponvel em: <http://docs.
Decreto/D6666.htm>. Acesso em: 22 out. 2016. opengeospatial.org/is/12-176r7/12-176r7.html>.
Acesso em: 22 out. 2016.
CAMBOIM, S. F. Arquitetura para integrao de dados
inter ligados aber tos INDE-BR. 2013. 140f. Tese SANTOS, D. I mplementao de um geocatlogo
(Doutorado em Cincias Geodsicas) Universidade utilizando banco de dados orientado a grafos para
Federal do Paran, Curitiba, 2013. apoio metodologia SERVUS. 2016. 82f. Dissertao
(Mestrado em Computao Aplicada) Universidade de
DALTIO, J.; CAR VALHO, C. A. Um framewor k para Braslia, Braslia, 2016. Disponvel em: <http://alexandre.
re c u p e r a o s e m n t i c a d e d a d o s e s p a c i a i s. I n : zaghetto.com/wp- content/uploads/2016/07/
BRAZILIAN SYMPOSIUM ON GEOINFORMATICS, 13, 2012, Disserta%C3%A7%C3%A3o_Vers%C3%A3oFinalParaE
Campos do Jordo. Proceedings... So Jos dos Campos: di%C3%A7%C3%A3o.pdf >. Acesso em: 22 out. 2016.
MCTI/INPE, 2012. p. 60-65.
USLNDER, T. Service-oriented design of environmental
information systems. Vol. 5. Karlsruhe: KIT Scientific,
2010.

Setembro/Dezembro 2016 106


Artigos

O porqu de governana de dados


em organizaes de controle

Ricardo Dantas Stumpf  RESUMO


servidor do Tribunal de Contas
da Unio, lotado na Secretaria Existem diferentes nveis de governana dentro de
de Solues de TI, onde atua uma organizao, seja lidando com estratgia, com TI,
na rea de Gesto Tcnica de com dados em geral ou dados abertos. Dados so ativos
Dados. , tambm, bacharel gerenciveis, seja para o funcionamento saudvel da ins-
em Cincias da Computao tituio, seja para anlises de dados sofisticadas. Este ar-
pela Universidade de Braslia. tigo trata de definir a utilidade da governana dos dados
nesse contexto, assim como elementos bsicos para sua
implantao, com um vis para organizaes de controle.

Palavras-chave: Governana de dados. Gesto


de dados. Cincia de dados.

1. INTRODUO

O que importante em uma organizao? Pes-


soas, oramento, equipamentos e imveis, dados
difcil sequer pensar no funcionamento de organiza-
es caso falte algum desses elementos, o que prova
a crucial importncia de todos eles. Vrios desses so
ativos essenciais maioria das entidades e, como tais,
devem ser bem geridos e governados, de modo a
maximizar o seu valor. Em sntese, gerir garantir
que fazemos certo as coisas, enquanto governar
garantir que fazemos as coisas certas (WODZINSKI
et al, 2015).
E agora que o TCU est investindo fortemente
em anlise de dados, cuidar dos dados tornou-se ainda

107 Revista do TCU 137


O porqu de governana de dados em organizaes de controle // Artigos

retranca imagem

ctrl + Shift + click para liberar


retranca

mais crtico, como pode-se inferir do trecho do relatrio A 2 edio do guia de Governana do TCU
trimestral abaixo: (2015) traz um resumo da interao entre a gesto e a
governana:
[C]hegou-se ao consenso dos trs principais desafios So funes da governana:
que o tribunal dever superar para obter bons resultados
com a anlise de dados: o desafio tcnico, especialmente a. definir o direcionamento estratgico;
vinculado qualidade dos dados; o regulatrio, atinente
s restries legais e normativas; e o cultural, concernente b. supervisionar a gesto;
aos aspectos comportamentais das pessoas envolvidas
(RELATRIO TRIMESTRAL TCU 4 TRIMESTRE/2014, p. 101). c. envolver as partes interessadas;

Figura 1:
TCU - Referencial bsico de Governana aplicvel a rgos e entidades da Administrao Pblica, 2 edio, p. 32

Setembro/Dezembro 2016 108


Artigos

d. gerenciar riscos estratgicos; do o professor Valdemar Setzer (2015), da Universidade


de So Paulo.
e. gerenciar conflitos internos; Dado uma sequncia de smbolos quantifica-
dos ou quantificveis, enquanto informao uma
f. auditar e avaliar o sistema de gesto e controle; e abstrao na mente de algum.
Como exemplo simples, a sequncia de smbolos
g. promover a accountability (prestao de contas 880. um dado, digital ou no. Se algum reconhece
e responsabilidade) e a transparncia (TCU, 880 numa lista de salrios, ento temos a informao
REFERENCIAL BSICO DE GOVERNANA de um salrio numrico com 880 unidades.
APLICVEL A RGOS E ENTIDADES DA J conhecimento exige uma abstrao e expe-
ADMINISTRAO PBLICA, 2 edio, p. 31). rimentao pessoal (SETZER, 2015). Um funcionrio
de uma empresa sabe, da experincia, que se trata de
E essa lgica vale tanto para o nvel estratgico, R$880,00, valor do salrio mnimo em outubro de 2016
como para os diversos nveis e facetas mais focadas da atribudo a um colaborador recm-contratado. O nme-
instituio. Em torno da governana e gesto corpora- ro 880 passou de dado a informao e, ento, a conhe-
tivas, gravitam, dentre outras, a governana e gesto de cimento. Finalmente, um auditor tem competncia
tecnologia da informao e, em torno desta, a governan- para interagir e atuar sobre esse conhecimento durante
a e gesto de dados produzidos e custodiados. Mesmo uma fiscalizao.
a governana e gesto de dados tambm se subdivide Esse processo acontece diariamente em ambien-
nas organizaes mais complexas. tes profissionais: processo um documento, fluxo de
trabalho repetvel, instrumento jurdico, cdigo de com-
2. DADO E INFORMAO putador em execuo ou salincia de ossos? Depende.
a que a Governana de dados entra, ao uti-
comum usarmos dado e informao como si- lizar o conhecimento e competncia das pessoas para
nnimos, assim como conhecimento e competncia. A definir polticas, responsabilidades, glossrios, meta-
rigor, porm, representam conceitos diferentes, segun- dados, fluxos de trabalho dos dados em movimento,

Figura 2:
Diferentes nveis de governana gravitando simultaneamente

109 Revista do TCU 137


O porqu de governana de dados em organizaes de controle // Artigos

3. NOVO PETRLEO DIGITAL


Figura 3:
Exemplo de como smbolos relacionam-se com diversos conceitos
Dados esto sendo chamados de novo petrleo
(VANIAN, 2016), mas sempre foram importantes e pre-
sentes, mesmo antes do formato digital. Contudo, nosso
foco est nos dados digitais, que esto crescendo em tal
ritmo e variedade que tm sido associados a tsunamis,
avalanches e tempestades de dados, ou Big Data. Os
dados internos, normalmente os mais alinhados com os
processos de trabalho internos da corporao, so cha-
mados de Small Data (HENDERYCKX, 2016).
Uma tendncia nas empresas investir cada vez
mais em anlise e visualizao de dados, de modo a
vislumbrar mais oportunidades de negcio e a aumen-
tar a eficincia operacional. Da mesma forma, rgos
pblicos, em especial os de controle, esto coletando
grandes quantidades de dados de seus parceiros e audi-
tados, alm do feedback da sociedade nas redes sociais.
Jan Henderyckx, presidente da DAMA Benelux,
apresentou um modelo genrico para o ciclo dos dados
(figura 4):
Nesse modelo, observe que os dados que vm
monitoramento e linhagem de dados que permitam das reas de negcio precisam ser bem governados.
organizao melhorar a qualidade, descoberta e enten- Isso no significa que os dados externos custodiados
dimento desses, de modo a simplificar a extrao de no precisam de governana, mas as preocupaes pri-
informaes e conhecimentos, resultando em melhores mrias podem ser outras. Por exemplo, o TCU possui
anlises e decises de negcio. um ambiente utilizado pelo Controle Externo como

Figura 4:
Modelo de ciclo de
dados, adaptado
(HENDERYCKX, 2016)

Setembro/Dezembro 2016 110


Artigos

laboratrio de explorao e cruzamento de dados ex- sunto) s agora est ganhando energia, visto que as empre-
ternos e internos. sas e organizaes que dependem de dados querem extrair
A rea responsvel por esse laboratrio adota, o mximo valor desse ativo, cada vez mais abundante e
quando necessrio, o Princpio da Oportunidade, que mais complexo. Cabe lembrar que j podem existir reas
justifica a incluso ad hoc de novas bases, mesmo antes que governam bem seus dados. Nesses casos, segundo o
de haver tratamentos de qualidade e documentao poltico ingls Lucius Cary, quando no necessrio mu-
mais detalhados. O motivo no deixar, no contexto dar, necessrio no mudar (In: SEINER, 2014).
de alguma auditoria, a janela da oportunidade de anlise A matria-prima para o trabalho de qualquer r-
passar. A partir da, porm, tal base torna-se elegvel a go de controle informao. E seus produtos finais
um processo de tratamento mais completo. (determinaes, recomendaes) so fontes primrias
Alm disso, existe a questo contextual. Bases de informao a todos os seus auditados.
externas de baixa qualidade podem ser teis para se
descobrir achados de auditoria em sistemas de infor- 5. GOVERNANA DE DADOS
mao, enquanto bases derivadas de boa qualidade,
com documentao completa de metadados, facilita a Finalmente chegamos a uma definio formal,
anlise relativa ao uso efetivo dos repasses de recursos segundo John Ladley (2012):
financeiros, por exemplo.
Quando o modelo apresentado tem baixa quali- Governana de dados a organizao e implementao de
dade e organizao, surgem problemas em trs momen- polticas, procedimentos, estrutura, papis e responsabilidades
tos (DYKES, 2016): que delineiam e reforam regras de comprometimento,
direitos decisrios e prestao de contas para garantir o
a. as pessoas no confiam nos dados a priori; gerenciamento apropriado dos ativos de dados.

b. h tantas fontes que no se sabe o que usar; e Da definio, discutiremos brevemente a necessi-
dade de princpios, polticas, curadores de dados e clas-
c. h paralisia de anlise, quando difcil saber
quando a anlise est boa o suficiente.

Isso dito, podemos nos voltar para gesto e go- Figura 5:


Viso sinttica do framework para dados, segundo DMBoK
vernana dos dados.

4. GESTO DE DADOS

Organizaes costumeiramente j gerem seus


dados, em especial os estruturados e semiestruturados.
Quanto forma, comum que a gesto siga boas prti-
cas em seus nichos, normalmente pela fora da neces-
sidade e pelo conhecimento compartilhado pelos pares
internos e parceiros, como os da comunidade TI-Con-
trole, com cerca de 20 rgos de controle que discutem
melhores prticas em TI. A sistematizao dos nichos de
atuao aparece em frameworks como o preconizado no
DMBoK (MOSLEY et al., 2012), da DAMA International.
Na nova verso desse framework, at tcnicas
mais modernas, como integrao por servios web e
publish-subscribe so contemplados como formas de da-
dos circularem entre sistemas ou mdulos de sistemas,
localmente ou em nuvem (BRADLEY, 2016).
Apesar disso, o tema Governana de dados (que
uma espcie de cola a todos os processos ligados ao as-

111 Revista do TCU 137


O porqu de governana de dados em organizaes de controle // Artigos

sificao dos dados, glossrios e metadados, lideranas 5.3 CURADORIA E CLASSIFICAO


e abordagens de implantao.
O importante saber dosar. Governana de da- Os curadores (data stewards, em ingls) so as pes-
dos muito burocrtica um convite desobedincia; j soas ou grupos de pessoas que tm responsabilidades de
o excesso de flexibilidade pode levar desgovernana, cuidar dos dados sob sua alada de negcio. Essa
a uma gesto de dados menos eficiente. Por isso, deve- uma mudana fundamental, pois compartilha com a TI
-se comear pela definio dos princpios. a misso de cuidar dos dados corporativos.
Suponha que o princpio da qualidade tenha sido
5.1 PRINCPIOS adotado. Isso significa que as reas de negcio tm que
se preocupar com a qualidade do dado que geram para
Princpios bem especficos, lgicos e viveis faci- si e para as outras, e devem reportar problemas de qua-
litam todos os passos seguintes. Por exemplo, se o prin- lidade em relatrios e outras fontes que venham de
cpio dados so ativos corporativos for adotado pela outras reas de negcio. O Escritrio de Governana
organizao, devemos tratar a entidade dados como de Dados, ou equivalente, o setor que auxiliar os
tratamos outros ativos: melhoria contnua, definio de curadores nessa tarefa.
responsabilidades etc (LADLEY, 2012). A partir da Lei n 12.527/2011, conhecida como
Cada organizao tem seus princpios. A tabela a Lei de Acesso Informao, formalizou-se como di-
1 abaixo exemplificativa e no-exaustiva. retriz para a Administrao Pblica a publicidade [das
informaes] como preceito geral e do sigilo como ex-
5.2 POLTICAS ceo. Assim, os curadores tambm devem ativamente
classificar as informaes que produzem ou custodiam,
Como diz John Ladley (2012), a poltica o que de modo a acelerar a disponibilizao dos dados pbli-
d dentes aos princpios. o documento formal que cos ou de restringi-los nos termos da lei.
faz a organizao adotar os princpios discutidos.
comum tambm a poltica definir responsabilidades 5.4 GLOSSRIOS E METADADOS
pelos dados (curadoria), assim como a estrutura orga-
nizacional que ir conduzir e monitorar os esforos de Glossrios, ou vocabulrios, definem e eliminam
Governana de Dados. ambiguidades em termos de negcio, como o termo
Como um bom exemplo, deixamos a sugesto processo, citado na seo 2. O TCU mantm o Voca-
de leitura da Poltica de Governana da Informao do bulrio de Controle Externo (VCE), criado para, segundo
Banco Central do Brasil, publicada pela Portaria n47, de o Ministro-Presidente Aroldo Cedraz, padronizar o tra-
20 de fevereiro de 2013, atualizada em 2016. tamento de informaes especializadas e conferir maior

Tabela 1:
Lista de alguns princpios para implantao de Governana de Dados

Princpios Descrio
Regra de ouro Todos os dados so tratados como ativo corporativo.
Federao H padres definidos para as estruturas de dados.
Eficincia Dados relevantes devem estar disponveis no momento certo, no lugar certo e no formato certo para usurios autorizados.
Qualidade Dados corporativos so medidos e geridos para terem qualidade.
Gesto de risco Manter conformidade com a legislao, polticas e normativos internos relativos a dados.
Colaborao Dados corporativos so recursos compartilhados e publicizados.
Contextualizao O contexto de uso do dado muda sua forma de armazenamento, tratamento e utilizao.
Inovao Novas tcnicas so incentivadas, seguindo-se os demais princpios.

Fonte: adaptado de LADLEY (2012)

Setembro/Dezembro 2016 112


Artigos

agilidade e preciso na recuperao dos contedos pre-


sentes nos sistemas de informao do TCU (VCE, p.5). Figura 6:
Capa da edio de janeiro/2016 do VCE do TCU
A definio clssica de metadados dado sobre
o dado. Mas podemos ampliar esse conceito em duas
vertentes: de negcio e tcnicos.
Os metadados de negcio so aqueles que con-
textualizam os dados armazenados ou em movimento.
Por exemplo, considere a tabela WZV da base de dados
TTNN (hipotticos). Como a rea de negcio e os espe-
cialistas de domnio conhecem esse assunto, eles podem
enriquecer os metadados existentes com informaes
especficas. Agora, os cientistas de dados sabero que a
tabela WZV tem os dados cadastrais de fornecedores e
que a base TTNN traz organizaes auditadas que, den-
tre outros, compraram daqueles fornecedores.
J os metadados tcnicos so aqueles que tra-
zem informaes de TI sobre os dados, como nomes
de campos e tabelas, datas de carga, verso, tamanhos,
tipos etc.
A magia acontece quando os metadados tc-
nicos e de negcio so integrados para descoberta e
uso das reas de anlise e de gesto de mudanas. No
TCU, h algumas iniciativas nesse caminho. Os dados
do VCE esto aos poucos sendo integrados a outras
solues de tecnologia da informao, de forma a oti-
mizar e uniformizar o uso dos conceitos. Outra uma organizacional para governar dados. A figura do CDO
ferramenta especializada em metadados que mostra, de (Chief Data Officer) cada vez mais comum. Essas so
forma integrada, informaes oriundas de modelagens algumas das formas utilizadas, segundo Bergson Rgo
de dados, integraes por ETL (Extract Transform Load) (2013):
e bases de dados corporativas (figura 7).
a. CIO liderando equipe centralizada na TI, que
5.5 ESTRUTURAS interage com o negcio;

Cada corporao tem sua cultura e necessidades, b. CDO interagindo com TI e uma rea de gesto
e no faria sentido haver apenas uma forma de estrutura de dados central do negcio;

Figura 7:
Exemplo editado de metadados tcnicos integrados

113 Revista do TCU 137


O porqu de governana de dados em organizaes de controle // Artigos

c. CDO interagindo com TI e vrias reas de gesto A estrutura hbrida particularmente interes-
de dados do negcio; ou sante, e utilizada na prtica em um grande banco mul-
tinacional (IPPOLITI, 2016). Dada a grande variedade
d. um CDO para cada grande linha de negcio, in- interna de dados disponveis, eles resolveram dividir a
teragindo com TI (hbrido). gesto desses em grandes linhas de negcio (figura 9).

5.6 ABORDAGENS DE IMPLANTAO


Figura 8:
Estrutura simples hierrquica (RGO, 2013) H trs formas estruturadas mais comuns de se
implantar Governana de Dados (SEINER, 2016):

a. Comando e controle;

b. Tradicional; e

c. No-invasivo.

Na abordagem comando e controle, o comit de


mais alto nvel define as regras, determina os curadores,
compra ferramentas e cobra resultados.
A tradicional identifica os curadores e os orienta
com processos mais genricos e ferramentas existen-
tes, e mede resultados analisando os dados envolvidos.

Figura 9:
Estrutura hbrida, adaptado (IPPOLITI, 2016)

Setembro/Dezembro 2016 114


Artigos

Por fim, a no-invasiva formaliza a curadoria ditor-Geral do Canad, em que esse um problema
tcita, foca em aplicar os processos existentes, esti- a ser combatido:
mula construo de ferramentas e uso das atuais e
mede resultado pelo aumento percebido em eficin- Um dos temas que unem muitas de nossas auditorias
cia e efetividade de capacidades de anlise. que os dados coletados de muitas organizaes
Como j frisamos, nenhuma necessariamen- governamentais ou so inutilizveis, ou no so usveis
te melhor que a outra. Depende da cultura e neces- ou no so utilizados (Auditor-Geral do Canad em
sidades de cada organizao. ROWLANDS, 2016).

4. CONCLUSO Para que tal reduo seja possvel, impera a


necessidade de governar tais dados na dose certa
Apesar da importncia atual do tema Gover- para cada caso e contexto, sempre com o olhar na
nana de Dados, esta ser ainda maior no futuro, no misso e viso da instituio.
qual haver muita automatizao, mesmo de ativi-
dades intelectuais, desde que repetveis. E os dados, REFERNCIAS
sejam oriundos de sistemas informatizados ou de
sensores em objetos do dia a dia, sero um instru- BRADLEY, C. The new DMBOK 2 discipline of Data
mento bsico para essa automatizao. Integration. Disponvel em: <https://www.brighttalk.com/
Isso significa que as organizaes devero webcast/12405/186095/the-new-dmbok-2-discipline-of-
capturar dados, armazen-los de forma eficiente data-integration>. Acesso em: 12 abr. 2016.
e automatizar anlises com algoritmos cognitivos
(HENDERYKCX, 2016). Segundo Ian Rowlands BRASIL, BANCO CENTRAL DO BRASIL BCB. Portaria n 47, de
(2016), metadados de negcio tero sua semntica, 20 de fevereiro de 2013. Dirio Oficial da Unio DOU, 21 de
e no apenas sua sintaxe, inferida por algoritmos e fevereiro de 2013. Seo 1, p. 24.
crowdsourcing (grandes grupos pensando e colabo-
rando juntos). BRASIL, Comunidade de Tecnologia da Informao
Tambm desafio crescente identificar e re- Aplicada ao Controle TI Controle. Sobre a Comunidade.
duzir o dark data, que representa perda de oportuni- Disponvel em: <http://www.ticontrole.gov.br/ticontrole/
dades, desperdcio de recursos e risco (ROWLANDS, sobre-a-comunidade/sobre.htm>. Acesso em: 20 out.
2016). Rowlands reitera trecho de declarao do Au- 2016.

115 Revista do TCU 137


O porqu de governana de dados em organizaes de controle // Artigos

BRASIL. LEI n 12.527, de 18 de novembro de 2011. Lei IPPOLITI, J. Implementing Data Governance Strategies.
de Acesso Informao. Disponvel em: <http://www. In: ENTERPRISE DATA GOVERNANCE ONLINE, 2016. Anais
planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/ eletrnicos 20 slides. Disponvel em: <http://video.
l12527.htm>. Acesso em: 20 out. 2016. 2011. dataversity.net/video/keynote-implementing-data-
governance-strategies/>. Acesso em: 12 fev. 2016.
BRASIL, TCU TRIBUNAL DE CONTAS DA UNIO.
Referencial bsico de governana aplicvel a rgos e LADLEY J. Data Governance: How to Design, Deploy
entidades da administrao pblica. Verso 2 Braslia: and Sustain an Effective Data Governance Program.
Tribunal de Contas da Unio. Secretaria de Planejamento, The Morgan Kaufmann Series on Business Intelligence.
Governana e Gesto. 80p. Disponvel em: <http://www. Morgan Kaufmann. 2012.
tcu.gov.br/governanca>. Acesso em: 20 out. 2016. 2014.
RGO, B. L. Gesto e Governana de Dados: Promovendo
______. Relatrio de Atividades: 4 trimestre de 2014 Dados Como Ativo de Valor Nas Empresas. Rio de Janeiro:
Braslia: Tribunal de Contas da Unio. Secretaria-Geral da Brasport, p. 60-74. 2013.
Presidncia, p.101. Disponvel em: <http://portal.tcu.gov.
br/publicacoes-institucionais/relatorios/relatorios-de- ROWLANDS, I. Data Management in Motion. In: DATA
atividades>. Acesso em: 20 out. 2016. 2015. MANAGEMENT CONFERENCE LATIN AMERICA, 2016, So
Paulo. Anais eletrnicos. So Paulo. DAMA Brasil, 2016.
______. Vocabulrio de Controle Externo do Tribunal de 25 slides. Disponvel em: <http://www.dmc-latam.com/
Contas da Unio Braslia: Tribunal de Contas da Unio. palestrantes/ian-rownlands/>. Acesso em: 19 set. 2016.
Instituto Serzedllo Corra. Disponvel em: <http://
portal.tcu.gov.br/vocabulario-de-controle-externo/>. SEINER, R. Non-Invasive Data Governance: The Path
Acesso em: 20 out. 2016. 2015. of Least Resistance and Greatest Success. Technics
Publications. 2014.
CANAD, Office of the Auditor General of Canada
OAG. Spring Reports of the Auditor General of Canada. ______. Comparing Approaches to Data Governance.
Auditor Generals Opening Statement. Disponvel Disponvel em: <http://tdan.com/comparing-
em: <http://www.oag-bvg.gc.ca/internet/English/ approaches-to-data-governance/20386>. Acesso em:
osm_20160503_e_41358.html>. Acesso em: 20 out. 5 out. 2016.
2016. 2016.
SE TZER, V. W. Dado, informao, conhecimento e
D M B O K . M O S L E Y, M . ; B R A C K E T T, M . ; E A R L E Y, S . competncia. Journal Data & Information 1(1), DAMA
HENDERSON, D. DAMA Guia para o cor po de Brasil: p. 38-55. 2015.
conhecimento em gerenciamento de dados. Technics
Publications, verso brasileira 2012. VANIAN, J. Why Data Is The New Oil. Fortune, Brainstorm
Tech. Disponvel em: <http://fortune.com/2016/07/11/
DYKES, B. Big Data Paralyzing Your Business? Avoid These data-oil-brainstorm-tech/>. Acesso em: 20 out. 2016.
3 Common Traps. Forbes, Entrepreneurs. Disponvel em: Julho de 2016.
<http://www.forbes.com/sites/brentdykes/2016/09/28/
big-data-paralyzing-your-business-avoid-these -3- WODZINSKI, M. et al. Building an I mpactful Data
common-traps/>. Acesso em: 20 out. 2016. Governance Program One Step at a Time. Disponvel em:
<https://www.brighttalk.com/webcast/10477/142503/
HENDERYCKX, J. Sustaining Data Driven Innovation. In: building-an-impactful-data-governance-program-one-
DATA MANAGEMENT CONFERENCE LATIN AMERICA, step-at-a-time>. Acesso em: 26 fev. 2015.
2016, So Paulo. Anais eletrnicos So Paulo: DAMA
Brasil, 2016. 42 slides. Disponvel em: <http://www.dmc-
latam.com/palestrantes/jan-henderyckx/>. Acesso em:
19 set. 2016.

Setembro/Dezembro 2016 116


Artigos

O georreferenciamento dos bens


imveis pblicos no sistema geodsico
brasileiro para fins de incorporao
no cadastro tcnico multifinalitrio:
construo da regularizao imobiliria
dos municpios

Davi Lopes Silva RESUMO


graduado em Geografia pela
Universidade Estadual do Cear UECE, Os bens pblicos so por natureza e origem
graduando em Computao pela patrimnio das cidades, contudo foram deixados de
Universidade Estadual do Cear UECE, lado nos cadastros tcnicos do Brasil, uma vez que
especialista em Geoprocessamento o objetivo era a arrecadao tributria, o que resul-
e Georreferenciamento pela tou em uma diminuta atualizao das informaes
Universidade Cndido Mendes UCAM dos permetros e limites dos bens pblicos ao lon-
e atualmente ocupa o cargo de Gerente go da histria. Este trabalho destaca a importncia
da Clula de Bens Imveis de Fortaleza. de utilizar o georreferenciamento de imveis no
sistema geodsico brasileiro Sirgas 2000 para o
levantamento das dimenses dos imveis, visando
integrao das informaes no Cadastro Tcnico
Multifinalitrio (CTM) que as cidades brasileiras
esto implantando. Apresenta-se tambm a rele-
vncia de registrar as atualizaes efetuadas nas
reas pblicas nos Cartrios de Registro de Imveis
(CRI). Utilizou-se como metodologia a bibliografia
brasileira existente acerca dos CTM e dos CRI e os
estudos de caso de diversos autores sobre o assun-
to. Enfatiza-se, ao final, a necessidade de incluir
nos cadastros tcnicos do CTM as informaes dos
bens patrimoniais, visando a centralizao, controle
e transparncia dos gastos pblicos.

Palavras-chave: Georreferenciamento. Bens p-


blicos. Sistema geodsico brasileiro. Cadastro tcnico
multifinalitrio.

117 Revista do TCU 137


O georreferenciamento dos bens imveis pblicos no sistema geodsico brasileiro para fins de incorporao no cadastro tcnico multifinalitrio: construo da regularizao imobiliria dos municpios // Artigos

retranca imagem

ctrl + Shift + click para liberar


retranca

1. INTRODUO titudo pela unidade de medida em metros do Sistema


Internacional de Unidades. Ocorre, ainda, que muitos
A partir do aperfeioamento das tcnicas geod- registros foram atualizados sem uma aferio precisa
sicas, das novas tecnologias e da importncia da pre- dos rgos atuantes municipais, o que pode levar, no
servao do patrimnio pblico, surgiu a necessidade futuro, sobreposio de registros imobilirios de par-
de localizar e delimitar os bens pblicos das cidades de ticulares sobre terrenos pblicos, podendo ocasionar
uma forma mais precisa, utilizando-se do georreferen- discusses e litgios.
ciamento de imveis. Recomenda-se a adoo de um CTM que en-
Aplicando os conhecimentos topogrficos e as volva um cadastro nico dos bens pblicos e particu-
tcnicas de levantamento planimtrico, apresenta-se lares para que se possa verificar se existe sobreposio
a relevncia de representar objetos espacialmente por de registros imobilirios ou ocupaes irregulares,
meio da criao de polgonos georreferenciados. De com a possibilidade de recursos administrativos para
forma simples e concisa, busca-se demonstrar a impor- impugnao nos CRI ou intervenes judiciais mais
tncia de conhecer, delimitar e localizar com preciso rpidas.
os bens imveis pblicos, visando a fomentar a incor- Este trabalho est amparado na Legislao Bra-
porao dessas informaes no Cadastro Tcnico Mul- sileira, que trata sobre o georreferenciamento de im-
tifinalitrio (CTM) das cidades. veis na resoluo n 01/2005 do Instituto Brasileiro de
Nas ltimas dcadas, os agentes pblicos inves- Geografia e Estatstica (IBGE), que alterou e definiu o
tiram em equipamentos e bens imveis voltados para novo sistema geodsico brasileiro, alm do Cdigo
o atendimento das necessidades da populao e pres- Civil Brasileiro, que detalha os bens considerados p-
tao de servios, o que ampliou consideravelmente o blicos. Contudo, no existe uma norma ou regra que
patrimnio imobilirio das cidades, gerando assim no- determine tambm a aplicao do georreferenciamento
vos bens que nem sempre possuam registros imobili- nos imveis e terrenos estatais. Considera-se tambm
rios assertivos ou atualizados em relao a seus limites para essa temtica a Portaria n 511/2009 do Ministrio
e localizao. das Cidades, que trata sobre as diretrizes para criao,
Os Cartrios de Registro de Imveis (CRI) rece- instituio e atualizao do CTM nos municpios bra-
beram e armazenaram, em alguns casos, informaes sileiros, alm de autores acadmicos que trabalham as
imprecisas, como a medio de distncias em passos ou questes em pauta, como Carneiro (2003), Pimentel
palmas, o que ao longo da histria brasileira foi subs- (2012), Erba (2005) e outros.

Setembro/Dezembro 2016 118


Artigos

2. DESENVOLVIMENTO srie de pontos, medindo-se todos os ngulos e lados e


uma orientao inicial (p. 10). Recomenda-se o uso de
Para fomento da gesto pblica, o municpio deve poligonais fechadas, uma vez que os pontos de partida
conhecer seu territrio alm dos limites geogrficos, in- e de chegada devero estar na mesma coordenada, vi-
clusive deve considerar para otimizao de recursos o sando ao clculo da rea dos bens pblicos.
levantamento do patrimnio pblico, como as praas, Entre o perodo de fevereiro de 2005 e fevereiro
os rios, os logradouros pblicos, os hospitais, as sedes de 2015, era permitido utilizar em concomitncia com
do governo, as creches, os postos de sade ou qualquer o Sistema de Referncia Geocntrico para as Amricas
bem registrado ou em sua posse. (Sirgas 2000), o South American Datum 1969 (SAD 69) e
No passado, para localizar uma propriedade era o Crrego Alegre, havendo respaldo na legislao deste
necessrio ler seu registro imobilirio ou memorial descri- pas para trabalhos tcnicos utilizando o georreferencia-
tivo para conhecer suas dimenses e reas, o que resulta- mento de imveis.
ria, ao final, em um levantamento de campo para aferio Com o crescimento do uso dessa ferramenta no
das medidas que nem sempre correspondem ao esperado. Brasil, diversos levantamentos foram realizados seguin-
Alm disso, nesses documentos cartorrios, tambm re- do esses sistemas de referncia, sendo considerados,
side a descrio dos confinantes, que se for originado de inclusive, para registro nos CRI, o que poder levar no
um registro muito antigo, pode no descrever o imvel futuro a litgios, caso os registros imobilirios no te-
ou o terreno limtrofe, mas mencionar o nome dos confi- nham agregado a informao do sistema de referncia
nantes ou fazer aluso geografia do local, como citao adotado nos ttulos antigos, uma vez que desconhecer
de rios, lagos, mares, encostas e montanhas. o sistema de referncia adotado implica a incorreta lo-
Acrescente-se tambm que utilizar endereos, calizao ou deslocamento de poligonais.
descrio do relevo e nomes de confinantes no cola- Desde 25 de fevereiro de 2015 o Sirgas 2000
bora com o passar do tempo para a correta e precisa reconhecido e adotado oficialmente para fins de georre-
localizao caso haja remoo de edificaes, novas ferenciamento, definido pela Resoluo da Presidncia
construes ou mudana de proprietrios, sem deixar do IBGE, que esclarece ainda:
de destacar tambm que os bens pblicos podem ser
alvo de ocupaes irregulares e descaracterizao de Para o desenvolvimento das atividades geodsicas,
propriedade por terceiros. necessrio o estabelecimento de um sistema
Para sanar esse problema, reduzir litgios e au- geodsico que sirva de referncia ao posicionamento
mentar a preciso de localizao de imveis, surgiu o no territrio nacional. A materializao deste sistema de
georreferenciamento, que pode ser definido como o ato referncia, atravs de estaes geodsicas distribudas
de descrever e definir a localizao de um imvel, por adequadamente pelo pas, constitui-se na infraestrutura
levantamento topogrfico, com equipamentos de preci- de referncia a partir da qual os novos posicionamentos
so, utilizados por profissional especializado (GEOR- so efetuados. (BRASIL, 2005).
REFERENCIAR, 2015).
Essa tcnica consiste em representar, por meio Para Erba (2005, p. 25), Os problemas derivados
de polgonos, num dado sistema de referncia padro, da localizao relativa desaparecem ao adotar o posi
o permetro de um imvel a partir de suas coordena- cionamento absoluto dos imveis. Nesse sistema, cada
das de localizao, com o objetivo de incorporao no detalhe levantado recebe uma coordenada correspon
CTM. Posteriormente, essas informaes podem ser dente a um sistema de referncia nico, podendo ser
objeto de sobreposio e comparao com os registros este municipal ou nacional. Com isso, o levantamento
pblicos ou servir para retificao de documentos imo- cadastral mensurado por coordenadas e sistema de re
bilirios nos CRI. ferncia nico contribui para a localizao de imveis,
De acordo com Zocolotti (2005), uma poligonal alm de possibilitar a comparao dos registros imobi-
representa uma srie de linhas consecutivas com com- lirios existentes e a realidade encontrada em campo.
primentos e direes conhecidas, obtidas mediante Conforme Carneiro (2003), o levantamento de
levantamento de campo. Esse pesquisador considera informaes e consequente cadastro tem no Brasil en-
tambm que O levantamento de uma poligonal re- foque de tributao, que desconsidera na maioria das
alizado atravs do mtodo de caminhamento, percor- vezes a parte sem interesse fiscal, como nesse estudo de
rendo-se o contorno de um itinerrio definido por uma caso, as reas pblicas.

119 Revista do TCU 137


O georreferenciamento dos bens imveis pblicos no sistema geodsico brasileiro para fins de incorporao no cadastro tcnico multifinalitrio: construo da regularizao imobiliria dos municpios // Artigos

Uma vez que essa autora considera o cadas- O cadastro de reas pblicas deve seguir o padro
tro municipal como uma ferramenta que deve ir alm dos demais cadastros tcnicos brasileiros, devendo pos-
do aspecto tributrio, devendo participar no plane- suir, no mnimo, considerando diretiva do Infrastructure
jamento, controle urbano e ordenamento territorial, for Spatial Information in Europe (Inspire), as seguintes
destaca-se: informaes: geometria da parcela, identificador ni-
co, referncia geodsica e ndice das parcelas para im-
O cadastro multifinalitrio definido por Dale & McLaughlin presso/publicao (PIMENTEL; CARNEIRO, 2012, p.
(1990) como um sistema de informaes territoriais 210). Nesse aspecto, ao criar um cadastro de reas p-
projetado para servir tanto a organizaes pblicas como blicas, estas devem estar aptas a se integrar aos demais
privadas, alm de servir aos cidados. Difere dos demais cadastros municipais contendo tambm esses dados.
sistemas de informaes territoriais por ser baseado em Para fins didticos e de entendimento, adota-se
parcelas. Serve de base para os demais tipos de cadastro o conceito de parcela cadastral definida pela Portaria n
(legal, fiscal etc) (CARNEIRO, 2003, p. 24). 511/2009, que trata toda e qualquer propriedade como
unidade a ser incorporada no CTM, inclusive os bens
Em consonncia com o pensamento de um cadas- pblicos, o que se transcreve a seguir:
tro territorial nas cidades, est Erba (2005, p. 21), que
demonstra uma declarao da Federao Internacional Art. 2 A parcela cadastral a menor unidade do cadastro,
de Gemetras em suas palavras a seguir: definida como uma parte contgua da superfcie terrestre
com regime jurdico nico.
Em concordncia com esta ltima afirmao est a
Declarao sobre o Cadastro redigida pela FIG, em 1995, 1 considerada parcela cadastral toda e qualquer poro
que afirma que o Cadastro um sistema de informao da superfcie no municpio a ser cadastrada.
territorial, normalmente baseado em parcelas, que
registra interesses sobre a terra, como direitos, restries e 2 As demais unidades, como, lotes, glebas, vias pblicas,
responsabilidades. Ainda acrescenta que o Cadastro pode praas, lagos, rios e outras, so modeladas por uma ou mais
ser estabelecido para arrecadao, legal e, ou, de apoio parcelas de que trata o caput deste artigo, identificadas por
ao planejamento, buscando sempre o desenvolvimento seus respectivos cdigos.
social e econmico, destacando, porm, que no existe
a necessidade de pensar em um Cadastro uniforme para 3 Dever ser atribudo a toda parcela um cdigo nico
todos os pases ou jurisdies. e estvel.

Setembro/Dezembro 2016 120


Artigos

Em seu art. 3, a referida Portaria do Ministrio caractersticas prprias do regime jurdico e legislativo
das Cidades explica que toda e qualquer poro da su- brasileiro, o que implica a necessidade de adequao do
perfcie territorial no municpio deve ser cadastrada em levantamento dos bens pblicos tambm nesse sentido.
parcelas, o que nos remete a partir da legislao para Esse autor tambm aborda a questo da responsabilida-
composio de um CTM que, dependendo da situao, de dos ordenadores territoriais no tocante observao
pode exigir o cadastro das parcelas das reas pblicas dos direitos e restries da propriedade, seja no meio
por meio de uma ou mais parcelas ou o que possibilitar urbano ou rural, o que se transcreve a seguir:
maior transparncia e preferncia dos cadastradores,
sendo estas parcelas identificadas por cdigos nicos. Um cadastro territorial baseado em parcelas observando
Segundo Pimentel e Carneiro (2012, p. 205), a de- os direitos, restries e responsabilidades da propriedade
finio da Federao Internacional de Gemetras retrata urbana ou rural, nos aspectos geomtricos, jurdicos,
claramente a questo da composio das informaes econmicos e de gesto, aqui no nosso pas, s na
no cadastro: atualidade est sendo ventilado e discutido interativamente
pelo poder pblico, instituies e comunidade cientfica,
Segundo definio da Federao Internacional de particularmente nos moldes da FIG e adequado realidade
Gemetras (FIG, 1995), a parcela a unidade territorial cultural do pas. Carecendo, no entanto, que as instituies
do cadastro e pode ser definida de muitas maneiras, e estudiosos perseverem na sua incluso em legislao
dependendo da sua finalidade para o cadastro. Por especfica explicitamente, com a designao da instituio
exemplo, uma rea com um tipo especfico de uso de terra; responsvel, regras e regulamentaes. (loc. cit.).
ou uma rea de domnio nico ou propriedade individual
ou de um grupo. Os limites podem ser formais ou informais Ao delimitar e cadastrar os bens imveis de uma
e para identificao dos polgonos utiliza-se um cdigo cidade, possvel atuar tambm na regularizao fun-
nico. diria, como apresenta Carneiro (2003, p. 25):

Esse autor recomenda, ainda, que qualquer ca- O trabalho de regularizao fundiria consiste em uma
dastro de parcelas territoriais deve ser multifinalitrio e srie de procedimentos tcnicos, jurdicos e administrativos
adotar padronizao, em suas palavras a seguir: (cadastro e levantamento topogrficos, anlise da origem
dominial do imveis, aes discriminatrias judiciais,
Indica-se que o levantamento das parcelas seja demarcaes, planos de legitimao de posses etc.), que
georreferenciado ao Sistema Geodsico Brasileiro, para
identificao inequvoca de seus limites. A projeo UTM
recomendada at que se defina uma projeo especfica
para cartografia em escala grande. (loc. cit.).

Na concepo de Fonseca (2010, p. 14), um dos


objetivos de montar um CTM em mbito municipal
o de desenvolver tambm um cadastro do patrimnio
pblico, descrevendo-o como uma relao de bens per-
tencentes ao patrimnio pblico.
Esse mesmo autor destaca que um cadastro para
ser multifinalitrio deve cumprir uma funo social,
pois Hoje j se tem um significado mais amplo e di-
verso sobre o cadastro, visualizando-se ento sua im-
portante funo social, devido s diversas informaes
que ele pode conter, deixando de ter somente a funo
de taxao, podendo ser ento considerado multifina-
litrio (loc. cit.).
Em sua tese, Galdino (2006, p. 56) destaca ainda
uma preocupao sobre o cadastro na forma de parce-
las, uma vez que esse formato deve preservar outras

121 Revista do TCU 137


O georreferenciamento dos bens imveis pblicos no sistema geodsico brasileiro para fins de incorporao no cadastro tcnico multifinalitrio: construo da regularizao imobiliria dos municpios // Artigos

visam acabar com a incerteza dominial, separando as reas pessoal, ou real, de cada uma dessas entidades. (BRASIL,
devolutas das particulares e legitimando a posse e o uso 2002).
de terras pblicas.
Os bens pblicos possuem finalidade desde sua
No caso das reas pblicas, deve-se acrescentar aquisio ou recebimento e devem ser classificados a
outras informaes importantes a serem coletadas para partir de sua afetao (destinao). Conforme Di Pie-
compor o referido cadastro: tipo de bem pblico, legis- tro (2000 apud CARNEIRO, 2003, p. 99), necessita-se,
lao de uso e ocupao do bem, dimenso do terreno ainda, de uma separao no tocante aos bens imveis
e da edificao, identificador de correspondncia imo- prprios, definidos na legislao como especiais e do-
biliria dos limites fsicos, valor de aquisio e valor de minicais, e os bens de uso comum do povo, haja vista
avaliao, caso exista. que os primeiros servem de fomento para instalao
Os bens pblicos foram classificados pelo Cdi- de equipamentos e prestao de servios e o segundo
go Civil Brasileiro como dominicais, de uso comum do integra o patrimnio com a finalidade de preservao e
povo e de uso especial. Ainda de acordo com a referida conservao pelo poder pblico.
Lei, no art. 99: Conforme Carneiro (2003), em virtude da no
obrigatoriedade e desinteresse dos proprietrios de im-
Art. 99. So bens pblicos: veis em atualizarem os registros imobilirios, criou-se
uma dicotomia entre o que existe registrado nos CRI em
I os de uso comum do povo, tais como rios, mares, relao realidade dos imveis brasileiros, sejam eles de
estradas, ruas e praas; propriedade pblica ou privada. No caso dos bens pbli-
cos, estes frequentemente so passveis de ampliao,
II os de uso especial, tais como edifcios ou terrenos reduo e incorporao, hajam intervenes efetuadas
destinados a servio ou estabelecimento da administrao pelos municpios que muitas vezes no so informadas
federal, estadual, territorial ou municipal, inclusive os de nos CRI, implicando o abismo entre a realidade e o li-
suas autarquias; mite legal da propriedade.
Para Haar (1992 apud ERBA, 2005, p. 24), a di-
III os dominicais, que constituem o patrimnio das ferena entre o limite real e o limite de posse frequen-
pessoas jurdicas de direito pblico, como objeto de direito temente resulta em litgio, custos administrativos e

Setembro/Dezembro 2016 122


Artigos

judiciais para a defesa e reintegrao da propriedade, o imveis gerou inmeras consequncias para a traje-
que transcreve-se a seguir: tria imobiliria histrica do Brasil, conforme explica
Erba (2005, p. 25) em parte de sua pesquisa a seguir:
Com relao ao cadastro, existem dois limites para as
parcelas: o limite legal, definido por Haar (1992) como uma No Brasil, grande parte dos trabalhos de medio efetuados
linha imaginria que no se pode localizar no terreno sem pelos profissionais de mensurao objetiva exclusivamente
um sinal que a materialize, exigindo para sua determinao levantar os fatos existentes, determinando assim somente
o estudo dos ttulos da parcela em questo, mais os ttulos os limites de posse das propriedades, desconhecendo
das propriedades vizinhas; e o limite da posse, que as causas legais correspondentes ao domnio efetivo.
determinado pelo uso do imvel, materializado por entes Este fato acaba provocando a generalizada e conhecida
naturais ou antropolgicos. situao de confuso de limites e sobreposio de ttulos
de propriedade. Este sistema tem como ponto fraco a
Em relao ao tpico anterior, prudente rela- falta de preciso causada pela subjetividade que existe
cionar e informar no ato de incorporao ao cadastro no momento em que se define o citado ponto de partida
a diferena entre o limite legal e o limite da posse, quando a parcela amarrada malha urbana. O fato de usar
uma vez que esses dados nem sempre so acresci- este tipo de referncia tem causado grandes problemas
dos no CRI de imediato, pois existem regras, custos nos sistemas de publicidade territorial de muitos pases,
e anuncia para o lanamento dessas atualizaes e gerando superposies de ttulos e conflitos de limites.
correes.
A partir da diferena entre os limites legais e de Para facilitar o balano contbil das cidades, reco-
posse, como ressaltam Carneiro (2003) e Erba (2005), menda-se incluir no ato do cadastro o valor de aquisio
implica-se tambm dizer que no existe a boa prtica do bem, visando a praticidade e agilidade na prestao
de atualizao das informaes nos CRI, esses ltimos de contas, como tambm possvel associar os investi-
que exigem para fins de atualizao e averbao o pa- mentos a cada patrimnio, facilitando a transparncia
gamento de taxas e emolumentos, alm da responsabi- dos gastos pblicos.
lidade tcnica. Contribui-se para essa necessidade as Normas
Em parte, essa dicotomia entre o cadastro mu- Brasileiras de Contabilidade Aplicada ao Setor P-
nicipal, os registros imobilirios e a realidade dos blico (NBCASP), institudas pelo Conselho Federal

123 Revista do TCU 137


O georreferenciamento dos bens imveis pblicos no sistema geodsico brasileiro para fins de incorporao no cadastro tcnico multifinalitrio: construo da regularizao imobiliria dos municpios // Artigos

de Contabilidade (CFC), que requerem das esferas ______. Ministrio das Cidades. Portaria n 511, de 7 de
pblicas uma prestao de contas dos investimen- dezembro de 2009. Diretrizes para a criao, instituio e
tos, visando a representar o valor real de cada bem atualizao do Cadastro Territorial Multifinalitrio (CTM) nos
pblico, o que tambm deve ser associado ao CTM municpios brasileiros. Dirio Oficial da Repblica Federativa
dos municpios. do Brasil, Braslia, DF, 8 dez. 2009, seo 1, p. 75.

3. CONCLUSO CARNEIRO, Andrea Flvia Tenrio. Cadastro imobilirio e registro


de imveis. Porto Alegre: Instituto de Registro Imobilirio do
O Brasil est desenvolvendo sua cultura cadas- Brasil, 2003.
tral baseado nos Cadastros Tcnicos Multifinalit-
rios (CTM), mas ainda persiste em focar o aspecto CONSELHO FEDERAL DE CONTABILIDADE (CFC). Contabilidade
tributrio. Nesse aspecto, inserir o georreferencia- aplicada ao setor pblico. 2008. Disponvel em <http://bit.
mento dos bens pblicos imveis nos CTM deve ly/1xdNMmH>. Acesso em: 25 set. 2015.
considerar no apenas seus limites e confrontaes,
mas tambm agregar informaes pertinentes ao ERBA, Diego Afonso, O cadastro territorial: passado, presente e
tipo de bem a ser cadastrado, visando no apenas futuro. In: ERBA, Diego Afonso; OLIVEIRA, Fabrcio Leal de; LIMA
a sua delimitao, mas servindo para transparncia JUNIOR, Pedro de Novais (Orgs.). Cadastro multifinalitrio como
dos gastos pblicos. instrumento de poltica fiscal e urbana. Rio de Janeiro: Studium,
Neste trabalho apresentou-se a oportunidade 2005 p. 13-40.
de modernizar e adequar os levantamentos e des-
cries dos imveis pblicos no sistema geodsico FONSECA, Cludio Eduardo. A importncia do cadastro tributrio
brasileiro para evitar perdas de patrimnio com so- na arrecadao municipal e na auditoria de tributos: estudo de
breposio de registros imobilirios de terceiros e caso do municpio de Belo Horizonte. 2010. 32 p. Trabalho de
para uma maior integrao com as plataformas bra- Concluso de Curso (Especializao em Auditoria em Tributos
sileiras em desenvolvimento. Municipais) Faculdade de Direito da Universidade Gama Filho,
Cabe ressaltar que para proteger as reas p- Belo Horizonte, 2010. Disponvel em: <http://bit.ly/2gkA92a>.
blicas, deve-se considerar cadastr-los no mesmo Acesso em: 22 nov. 2016.
ambiente dos particulares para evitar sobreposio
ou incorporao no patrimnio particular. Adotan- GALDINO, Carlos Alber to Pessoa Mello. Cadastro de
do essa metodologia, os municpios podero agre- parcelas territoriais vinculado ao sistema de referncia
gar outras informaes, como os investimentos e geocntrico: Sirgas 2000. 2006. 255 f. Tese (Doutorado em
uso atual, evitando, assim, desperdcio de recurso Engenharia Civil) Universidade Federal de Santa Catarina,
estatal. Florianpolis, 2006.
A histria brasileira demonstra a dicotomia
entre o limite real e o limite legal dos CRI. Contudo, GEORREFERENCIAR. In: MICHAELIS Dicionrio Brasileiro da
o georreferenciamento de imveis deve contribuir Lngua Portuguesa. 2015. Disponvel em: <http://bit.ly/2fJMzRj>.
para atestar a realidade dos imveis e servir para Acesso em: 20 nov. 2016.
atualizar essas informaes nos CRI, que possuem
papel importantssimo na defesa da propriedade. PIMENTEL, Jos; CARNEIRO, Andra Flvia. Cadastro territorial
multifinalitrio em municpio de pequeno porte de acordo com
REFERNCIAS os conceitos da portaria n. 511 do ministrio das cidades. Revista
Brasileira de Cartografia, Rio de Janeiro, v. 64, n. 1, p. 202-212,
BRASIL. Casa Civil. Lei n 10.406, de 10 de janeiro de 2002. Institui 2012. Edio especial.
o Cdigo Civil. Subchefia para Assuntos Jurdicos. Disponvel
em: <http://bit.ly/1hBawae>. Acesso em: 21 nov. 2016. ZOCOLOTTI FILHO, Carlos Alberto. Utilizao de tcnicas de
poligonao de preciso para o monitoramento de pontos
______. Instituto Brasileiro de Geografia e Estatstica. Resoluo localizados em galerias de inspeo: estudo de caso da U.
do Presidente n 1, de 25 de julho de 2005. Altera a caracterizao H. de Salto Caxias. 2005. 112 f. Dissertao (Mestrado em
do Sistema Geodsico Brasileiro. Disponvel em: <http://bit. Cincias Geodsicas) Universidade Federal do Paran,
ly/2glKejh>. Acesso em: 22 nov. 2016. Curitiba, 2005.

Setembro/Dezembro 2016 124


Artigos

Uso de tcnicas de inteligncia


artificial para subsidiar
aes de controle

Lus Andr Dutra e Silva  RESUMO


ser vidor do Tribunal
de Contas da Unio, Os servios cognitivos so uma alternativa basea-
Bacharel em Cincia da em Inteligncia artificial para a obteno de solues
da Computao pelo que so capazes de detectar padres de qualquer tipo
UniCeub, com cer tificao
em textos, imagens ou qualquer outra fonte de dados. A
em Engenharia de
seguir, feita a descrio dos experimentos de utilizao
Software pelo IEEE e em
de tcnicas de inteligncia artificial em bases no estru-
Gesto de Projetos pela
Universidade de Stanford. turadas, realizados pelo TCU. As etapas do projeto so
detalhadas e relacionadas s aplicaes e possibilidades
futuras. Os resultados desses experimentos foram muito
promissores e pretende-se adotar as tcnicas utilizadas
nesse perodo em novas iniciativas tecnolgicas para o
TCU e para a Administrao Pblica em geral.

Palavras-chave: Servios cognitivos. NLP. In-


teligncia artificial. Machine Learning. Minerao de
textos.

1. INTRODUO

Grande parte das informaes consultadas e pro-


duzidas pelo TCU so recebidas de rgos jurisdiciona-
dos, registradas em relatrios e instrues processuais,
votos, acrdos, despachos e outros documentos. Esses
registros so textuais e complexos e exigem recursos
sofisticados de interpretao para se obter o conheci-
mento linguisticamente representado, especialmente
em razo de os dados no estarem estruturados. Essa
caracterstica requer inmeras anlises e combinaes

125 Revista do TCU 137


Uso de tcnicas de inteligncia artificial para subsidiar aes de controle // Artigos

retranca imagem

ctrl + Shift + click para liberar


retranca

para explorao e agregao de valor s informaes e 5.300 acrdos proferidos entre 2014 e 2015. O resul-
ao processo de tomada de deciso. tado obtido revelou preciso mdia de mais de 96%.
Esse fato implica significativo esforo por parte
dos servidores do Tribunal para estruturao desses da- 2. DESENVOLVIMENTO DOS TRABALHOS
dos e sistematizao de conhecimentos para uso e to-
mada de deciso. Exemplo disso o esforo requerido Dado o carter exploratrio e o pioneirismo de
para a realizao de determinadas atividades de gesto uso de tcnicas de inteligncia artificial no mbito do
e controle, como o monitoramento de deliberaes do TCU, o desenvolvimento dos trabalhos foi dividido
TCU e as iniciativas de classificao e triagem de pro- em etapas de experimentao com foco inicial para
cessos de Tomada de Contas Especial (TCE). processos de tomada de contas especial. Dado o car-
Nesse contexto, o uso de ferramentas e algorit- ter experimental, muitas das anlises realizadas foram
mos amparados em modelos de machine learning para descartadas para que a melhor soluo surgisse. Em que
automatizao da interpretao de documentos revela- pese essa orientao, o trabalho sempre teve presente
-se essencial e estratgico para classificao e extrao a ideia de replicao para outros objetos de controle e
automtica de informaes contidas em fontes de dados desafios de negcio.
no estruturados. A primeira etapa consistiu na obteno dos do-
As tcnicas de inteligncia artificial exploradas e cumentos de processos de Tomada de Contas Especial
sistematizadas nesse contexto permitem o aprendiza- diretamente do repositrio do GED (Gerenciamento
do de mquina das caractersticas mais complexas de Eletrnico de Documentos), com o propsito de estabe-
conceitos presentes em diferentes documentos. Com lecer uma base local para futura minerao das peas de
isso, pretende-se estruturar e tornar disponveis e teis TCE. O volume de documentos utilizados nessa etapa
informaes inicialmente dispersas em diferentes do- foi de cerca de 680 mil peas, e, para a extrao deles foi
cumentos e formatos. utilizado um algoritmo em linguagem Python para aces-
A ttulo de informao, o desenvolvimento de so ao banco de dados de desenvolvimento e ao GED em
experimentos iniciais com o uso de tcnicas de Deep produo com a finalidade de realizar download de todas
Learning revelou-se bastante promissor. O prottipo foi as peas em pastas relativas a cada processo de TCE. Essa
realizado no perodo de 1 de julho a 31 de dezembro etapa foi realizada no perodo de 20 a 24 de fevereiro de
de 2015, e a prova de conceito realizada utilizou como 2016, e o principal desafio enfrentado foi o fato de que
base de treinamento cerca de 257 mil acrdos de 1993 o download das peas foi frequentemente interrompido
a 2013 e classificou deliberaes contidas no texto de devido a problemas de conexo, e no foi possvel, no

Setembro/Dezembro 2016 126


Artigos

incio, baixar todas as peas. No entanto, ao final, todas acelerar o processo de triagem e distribuio dos proces-
as peas de todos os processos de TCE foram baixadas. sos. O volume de documentos utilizados foram cerca de
Na segunda etapa, foi realizada a obteno da 680 mil peas, analisadas por meio de redes neurais do
base de dados do Cadastro de TCE em Apex e da base tipo Self-Organizing Maps, ou Kohonen Maps, median-
de Cadastro de TCE da CGU (Controladoria-Geral da te o software livre Somoclu em ambiente Linux. Essas
Unio), bem como os documentos de relatrios da CGU aes foram realizadas entre 4 e 10 de maro de 2016 e
em formato Word, com o propsito de compor a base de o principal desafio enfrentado foi o fato de que a grande
dados correlatos aos processos de TCE para realizao quantidade de documentos analisados demandou vrios
de minerao de texto nos documentos obtidos. O volu- dias consecutivos de processamento e a proporo en-
me de documentos utilizado nessa etapa foi de cerca de tre nmero de documentos que possuam classificao
2 mil peas e foi utilizado um script em SQL (Structured prvia para o nmero de documentos sem classificao
Query Language) para realizao dos dumps dos bancos seria muito discrepante para a obteno de um resulta-
de dados e acesso aos dados compartilhados da CGU do til. No obstante as dificuldades encontradas, foi
por compartilhamento da rede local. As aes dessa possvel classificar grande parte dos documentos por
etapa foram realizadas entre 2 e 3 de maro de 2016 e funo de governo usando por base o cadastro obtido
teve como principal desafio o fato de que nem todos os do sistema Apex utilizado at ento para as TCEs.
documentos em formato Word da CGU possuam meta- A quarta etapa foi a realizao da anlise das irre-
dados correspondentes no sistema de cadastro deles. Os gularidades dos processos da funo de governo Sade,
dados de cadastro do sistema em Apex correspondiam a com o propsito de classificar os processos enviados em
uma pequena frao do passivo existente de processos forma de planilha Excel que estavam pendentes de dis-
de TCE. Como resultado dessas aes, os dados baixa- tribuio. O volume de documentos analisados foi de
dos ficaram disponveis para anlise posterior. cerca de 3.146 peas por meio da tcnica de clustering
Na terceira etapa, foi realizado o agrupamento utilizando Self-Organizing Maps. Essa etapa foi realizada
das peas de processos de TCE de acordo com funo entre 11 e 21 de maro de 2016 e teve como principal
de governo e tipos de irregularidades constantes no sis- desafio o fato de que devido ao pequeno nmero de
tema de cadastro em Apex, com o propsito de tentar processos classificados previamente em relao ao to-
classificar automaticamente as peas no anotadas, que tal existente e conformao difusa das classificaes
compem a maioria dos processos, com a finalidade de de irregularidades, provavelmente o resultado no seria

127 Revista do TCU 137


Uso de tcnicas de inteligncia artificial para subsidiar aes de controle // Artigos

muito preciso, com isso, dos 3.146 processos identifica-


dos na funo de governo Sade, todos estariam com os
tipos de irregularidade II, III e IV, e a maioria tambm
com o tipo V. Nenhum desses 3.146 teria o tipo I, o que
segundo os especialistas deveria ser detectado para cerca
de pelo menos 10% dos processos.
A quinta etapa consistiu em criar o servio de
extrao de deliberaes e teve como propsito dispo-
nibilizar um servio web de extrao de deliberaes
de textos de acrdos com a finalidade de realizar a in-
sero dos tipos de deliberao Determinao a rgo/
Entidade de forma semiautomtica, no sistema Radar,
por meio de interface Apex. Cerca de 200 acrdos so
proferidos por semana, para analis-los foi utilizado
Deep Learning em Python com o framework Theano/
Keras, POS tagging usando a biblioteca livre Aelius,
expresses regulares e o framework Flask em Python
com a infraestrutura Werkzeug. Essa etapa foi realiza-
da no perodo de 22 a 28 de maro de 2016 e, durante
sua execuo, foi encontrado o desafio de que existem
muitas ambiguidades lingusticas a serem tratadas por cados pelos especialistas na rea de TCE, foi insatisfat-
meio de regras especficas na extrao de atributos de rio, pois as similaridades ficaram muito prximas umas
tipos de deliberaes de acrdos. Algumas dessas am- das outras. Sendo assim, o experimento foi considerado
biguidades necessitam de algum tipo de compreenso encerrado e, portanto, essa abordagem foi descartada.
do texto em nvel prximo ao da inteligncia humana. A stima etapa foi um experimento com os pro-
No obstante, a maior parte dos itens de deliberao do psitos de: analisar a estrutura dos relatrios da CGU e
tipo Determinao a rgo/Entidade identificada com definir quais informaes podem ser extradas e estru-
preciso maior do que 96% e seus atributos, segundo os turadas; aplicar algoritmos de correo de textos com
especialistas, tambm so extrados com alta preciso. elevado nvel de rudo proveniente de OCR (Optical
Sendo assim, o tipo de deliberao escolhido para de- Character Recognition); elaborar algoritmo de extrao de
monstrar a utilidade desse servio considerado o mais informaes semelhante ao utilizado para o Extrator de
adequado para que haja um elevado grau de sucesso na Deliberaes; disponibilizar interface de validao para
iniciativa de automatizar o processo de extrao. os especialistas em TCE; definir critrios de classificao
A sexta etapa foi dedicada ao propsito de es- e encaminhamento com base nas informaes extra-
tabelecer correlao entre os textos das instrues de das; classificar e sugerir encaminhamento por meio da
TCE realizados pelo TCU e os 37 pargrafos-padro, interface de validao; e validar a classificao e encami-
correspondentes a cada tema, disponveis como aux- nhamento pelos especialistas. O volume de documentos
lio no portal. O volume de documentos utilizado foi envolvido foi de cerca de 3.800 relatrios, e a tcnica
de cerca de 5.997 instrues processuais de TCE, e as utilizada foi Information extraction usando expresses re-
tcnicas utilizadas nessa abordagem foram similaridade gulares e cruzamento de dados estruturados com base
lxica e semntica utilizando o algoritmo de distncia nas entidades extradas dos documentos. Essa etapa foi
de edio Levenshtein e cosseno entre os vetores de Bag realizada no perodo de 8 a 26 de abril de 2016 e teve
of Words. Essas aes ocorreram entre 1 e 7 de abril de como principal desafio o fato de que a qualidade dos
2016 e tiveram como principal desafio o fato de que a documentos digitalizados no suficiente para garantir
similaridade entre cada tema e as instrues elevada extraes que correspondam ao mesmo grau de confia-
qualquer que seja o tema escolhido, sendo assim, mui- bilidade alcanados pela leitura realizada pelos auditores
to difcil distinguir com exatido a presena dos par- que instruem TCE. Ao final, essa etapa teve os seguin-
grafos-padro em cada instruo analisada. Portanto, o tes resultados: com a ajuda de especialistas em TCE,
resultado foi o fato de que o percentual de similaridade foram definidas as informaes a serem estruturadas e
apurado para cada instruo/pargrafo, conforme indi- extradas dos relatrios originrios da CGU em formato

Setembro/Dezembro 2016 128


Artigos

Word; foram realizadas extraes de informaes nesses do Extrator de Deliberaes; servio REST de extrao
relatrios que permitiram preencher com boa preciso de entidades de relatrios de TCE; interface de valida-
uma minuta de instruo para o tipo de irregularidade o do Extrator de Contedo de TCE.
Omisso no dever de prestar contas; foram realizados A nona etapa, realizada entre 8 e 15 de julho de
cruzamentos das informaes extradas com sistemas 2016, teve como propsito a melhoria de documentos
estruturados, tais como o Sisobi, Siconv, Siafi; as mes- digitalizados por meio da utilizao de servios terceiri-
mas extraes realizadas em documentos em formato zados. Foi utilizada uma amostra de dez relatrios com
Word passou a ser realizada tambm para os relatrios grandes problemas de digitalizao, e a API Google Vi-
digitalizados em PDF, que so de menor qualidade de- sion foi utilizada para essa tentativa. O desafio principal
vido ao processo de OCR; foi disponibilizada uma in- era melhorar a qualidade do texto extrado dos documen-
terface de validao do extrator para os especialistas tos digitalizados de TCE sem recorrer a novo processo
em TCE. As extraes realizadas por esse experimento de digitalizao. No entanto, o resultado alcanado no
foram consideradas teis na gesto do estoque de TCE. foi melhor, em termos de quantidade de erros, do que o
Segundo os especialistas, o trabalho que realizado de software de OCR adotado no mbito do TCU (Adobe).
forma manual para este fim pode ser parcialmente au- A dcima etapa, entre 16 e 25 de julho de 2016,
tomatizado, reduzindo, assim, o tempo necessrio para teve como propsito o desenvolvimento da primeira
a distribuio/triagem de TCE. No entanto, a gerao verso do servio de reconhecimento de entidades men-
automtica de minutas foi considerada problemtica cionadas, NER (Named Entity Recognition), capaz de extrair
pelos especialistas devido ao fato de apresentarem da- de qualquer texto os nomes de pessoas fsicas, pessoas
dos que no preenchem totalmente as necessidades dos jurdicas, CPF, CNPJ e referncias normativas. O volume
auditores que instruem TCE. de documentos utilizados para treinar os modelos neurais
Na oitava etapa, realizada entre 27 de abril e 25 de reconhecimento de entidades foi de cerca de 58 mil
de maio de 2016, foram feitas as primeiras entregas com acrdos e a base Amaznia da Universidade de Lisboa,
o propsito de disponibilizar as primeiras verses dos contendo as anotaes manuais de cada tipo de entida-
servios previstos no cronograma do projeto. Conforme de mencionada. Para esse fim, foi utilizado o framework
cronograma do projeto de criao de servios cognitivos, de machine learning Apache OpenNLP em Python e Java,
esto disponveis para validao e acesso os seguintes com anotaes manuais e automticas em textos de acr-
produtos em sua primeira verso: servio REST de extra- dos. Com a utilizao de algoritmos de machine learning
o de deliberaes de acrdos; interface de validao no lugar de regras pr-definidas, a preciso e as demais

129 Revista do TCU 137


Uso de tcnicas de inteligncia artificial para subsidiar aes de controle // Artigos

mtricas associadas podem no ser as ideais enquanto Indexing um mtodo estatstico que liga termos em
no houver uma grande quantidade de textos anotados uma estrutura semntica til, sem anlise sinttica ou
manualmente. A primeira verso do extrator de entidades semntica e sem interveno manual. Usando esse m-
genrico foi exposta como servio web na infraestrutura todo, cada documento representado no por termos,
de produo. Como foi separada uma base de valida- mas por conceitos que so verdadeira e estatisticamente
o no treinada de 10 mil sentenas aproximadamente independentes de uma forma que os termos no so.
para avaliar a qualidade do servio web NER, foi obtido
um score F1 de cerca de 81% para pessoas fsicas, o que 3. CONCLUSO
corresponde ao estado da arte em termos de extrao de
entidades mencionadas. A mtrica F1 a mais adequada Os servios cognitivos desenvolvidos podem ser
para demonstrar o equilbrio entre preciso e recall, que utilizados de forma bem-sucedida por outros sistemas,
deve ser o objetivo a ser buscado. com a finalidade de aprimorar os processos de trabalho
Na dcima primeira etapa, entre 1 de agosto do TCU e da Administrao Pblica, pois inerente
e 14 de setembro de 2016, ocorreu o desenvolvimen- ao trabalho do TCU e outros rgos a necessidade de
to da segunda verso do extrator de entidades genri- estruturar textos produzidos continuamente e que de-
co em Java puro, utilizando nativamente a biblioteca pendem da classificao e extrao das informaes
OpenNLP e os modelos treinados anteriormente para a contidas nessas bases no estruturadas.
primeira verso do NER. O principal desafio foi o fato Portanto, a disponibilizao desses servios pode
de que a portabilidade de cdigo Python para Java nem servir para conferir maior exatido ao trabalho de instru-
sempre possvel em muitas customizaes. Portanto, o de processos, bem como para colocar disposio,
essa iniciativa poderia no ser bem-sucedida caso um para os profissionais de Controle Externo, contextos per-
ou mais frameworks utilizados em Python no existis- tinentes a todo trabalho desenvolvido de forma textual.
sem de forma similar em Java. No obstante, o servio Ao elaborar determinado relatrio, por exemplo,
NER, de acordo com a arquitetura padro de servios toda a jurisprudncia existente sobre o tema desenvolvido
do TCU, Arquitetura de Referncia 8, foi desenvolvido poderia ser automaticamente relacionada ao texto nascente
e encontra-se em produo no ambiente JBoss 6 EAP. de forma a simplificar o processo de busca por informaes
A dcima segunda etapa, ocorrida entre 16 de relevantes ao contedo a ser elaborado. Outro exemplo de
setembro de 2016 e 11 de outubro de 2016, teve como uso seria a elaborao de resumos de textos recebidos de
objetivo a construo de um servio capaz de detectar rgos jurisdicionados de forma automtica, para agilizar o
possveis erros materiais em acrdos proferidos pelo processo de anlise desses documentos externos.
TCU antes de serem oficializados. Foram utilizados cer- Alm disso, podem-se elaborar, por meio de ser-
ca de 600 documentos para o teste da ferramenta dentre vios cognitivos, clippings personalizados a respeito de
cerca de 1 mil acrdos apontados por uma inspeo cada assunto tratado em determinado trabalho. Assim,
realizada pela Corregedoria do TCU como possuidores os auditores tero sempre as informaes mais atua-
de erros materiais em sua elaborao. O resultado alcan- lizadas que subsidiem a elaborao dos relatrios de
ado pelo servio cognitivo foi uma captura de cerca de fiscalizao e todos os demais documentos necessrios.
40% dos erros materiais presentes nos acrdos, aps
a verificao da grafia correta dos nomes dos respons- REFERNCIAS
veis, CPF e CNPJ inexistentes ou pertencentes a pessoas
fsicas j falecidas ou a pessoas jurdicas inativas. NOVELLI, Andreia, OLIVEIRA, Jos. Simple Method for Ontology
A dcima terceira etapa, em andamento desde 18 Automatic Extraction from Documents. International Journal of
de outubro de 2016, tem como objetivo a disponibiliza- Advanced Computer Science and Applications. Vol 5. No. 12. 2012
o de um servio de extrao automtica de ontologias
em formato OWL, de documentos de texto, utilizando MADDI, Govind, VELVADAPU, Chakravarthi. Ontology
algoritmos de machine learning. So utilizados cerca de Extraction from text documents by Singular Value
280 mil documentos de jurisprudncia do TCU. utili- Decomposition. ADMI. 2001
zada a tcnica Latent Semantic Indexing realizando a de-
composio da matriz W de documentos x conceitos, BERRY, Michael, DUMAIS, Susan, OBRIEN, Gavin. Using Linear
obtida pela tcnica Bag of Words e normalizao TF-IDF, Algebra for Intelligent Information Retrieval. SIAM Review.
usando Singular Value Decomposition. Latent Semantic Vol 37. No.4, pp-573-595, December 1995.

Setembro/Dezembro 2016 130

Você também pode gostar