A Evolução Do Controle Na Era Digital
A Evolução Do Controle Na Era Digital
A Evolução Do Controle Na Era Digital
Revista do Tribunal de Contas da Unio Brasil ano 48 nmero 137 Setembro/Dezembro 2016
A Evoluo do Controle na
Era Digital
REVISTA doTCU
Fiscalizao a servio da sociedade
Revista do Tribunal de Contas da Unio Brasil ano 48 nmero 137 Setembro/Dezembro 2016
Copyright 2016, Tribunal de Contas da Unio
Impresso no Brasil / Printed in Brazil
FUNDADOR
Os conceitos e opinies emitidas em trabalhos doutrinrios Ministro Iber Gilson
assinados so de inteira responsabilidade de seus autores.
SUPERVISOR
Ministro Aroldo Cedraz de Oliveira
Permite-se a reproduo desta publicao, em parte ou no
todo, sem alterao do contedo, desde que citada a fonte e CONSELHO EDITORIAL
sem fins comerciais. Ministro-substituto Augusto
Sherman Cavalcanti
www.tcu.gov.br Procurador-Geral Paulo Soares Bugarin
Eduardo Monteiro de Rezende
Rainrio Rodrigues Leite
Misso Flvia Lacerda Franco Melo Oliveira
TRADUO
Secretaria de Relaes Internacionais
Projeto Grfico
Pablo Frioli
Imagens
iStock
Centro de Documentao
SAFS Quadra 4 Lote 1
Edifcio Anexo III - Sala 21
Braslia-DF
Revista do Tribunal de Contas da Unio. - v.1, n.1 (1970) - . Braslia : TCU, 70.042-900
1970- . revista@tcu.gov.br
v.
De 1970 a 1972, periodicidade anual; de 1973 a 1975, quadrimestral; de 1976 Impresso pela Sesap/Segedam
a 1988, semestral; 1989, quadrimestral; 1990 a 2005, trimestral; 2006, anual; a
partir de 2007, quadrimestral.
ISSN 0103-1090
P rezado leitor,
Carta ao
A Administrao Pblica atravessa um perodo marcado por desafios importantes,
provocados pela evoluo tecnolgica da Era Digital e pelo envolvimento crescente da sociedade
na formulao de polticas pblicas e em discusses sobre eficcia e transparncia na aplicao de
Leitor recursos do Estado. Testemunhamos uma transformao nas relaes entre governo e cidados,
qual o controle externo no pode e no vai ficar indiferente.
Os que acompanham a Revista do TCU sabem que o tema no indito nesta publicao.
Ainda assim, certo que estamos longe de esgotar o assunto, haja vista a amplitude de
possibilidades e perspectivas que essa nova era nos traz. A presente edio, em particular,
dedica-se a um olhar para o futuro prximo para os avanos que podero ser conquistados
a partir das mais modernas tcnicas de minerao de dados, anlise semntica de textos,
geoprocessamento e realidade virtual.
Investimentos em cincia e tecnologia so essenciais ao desenvolvimento sustentvel e
construo de economias produtivas, com sociedades mais justas e inclusivas. Segundo a Organizao
para Cooperao e Desenvolvimento Econmico (OCDE), uma das lies mais importantes das
ltimas duas dcadas foi o papel fundamental da inovao no desenvolvimento econmico.
Assim, ao intensificar o uso da Tecnologia da Informao no controle externo e compartilhar suas
experincias, o Tribunal de Contas da Unio (TCU) aponta caminhos a serem seguidos pelo Estado,
de modo a tornar-se mais eficiente, transparente e eficaz no atendimento aos anseios da populao.
No h dvidas de que a atividade de auditoria, na Era Digital, passa necessariamente pelo uso
intensivo do assim chamado Big Data Analytics. O processamento de volumes colossais de dados,
para deles extrair conhecimentos teis gesto pblica e sua fiscalizao, torna-se cada vez mais
presente graas evoluo da aprendizagem de mquina e da inteligncia artificial. Como nos
lembra o entrevistado desta edio, Cezar Taurion, os avanos nessa rea so to rpidos que temos
dificuldade at mesmo em imaginar os resultados que podero ser alcanados nos prximos anos.
Ao assumir posio de vanguarda no uso desses instrumentos, o TCU j tem colhido frutos
de modelos preditivos e algoritmos inteligentes produzidos por nossas prprias equipes tcnicas.
Como relata na coluna Opinio o Secretrio Wesley Vaz, responsvel por tais iniciativas,
trata-se de incorporar novas ferramentas rotina de trabalho dos auditores, de modo a escolher
melhor as aes de controle a serem realizadas pelo Tribunal e, ato contnuo, execut-las de
forma eficiente, tempestiva e precisa, conferindo assim maior efetividade atuao desta Corte.
De maneira similar, esto em desenvolvimento novos mtodos de trabalho com base
Bruno Spada
Entrevista
07 Opinio 13 Destaque 17
Setembro/Dezembro 2016 5
Sumrio
81 O potencial de dados
de sensoriamento
remoto na fiscalizao
de obras pblicas
Osmar Ablio de
Carvalho Jnior
Renato Fontes Guimares
Roberto Arnaldo
Trancoso Gomes
97 Implementao de
um geocatlogo para
auxlio na localizao e
recuperao de dados
geogrficos abertos
Artigos Rherman Radicchi
Teixeira Vieira
18 Fundamentos de Andr Delgado de Souza Drausio Gomes
uma auditoria em Leonardo Pereira Garcia dos Santos
realidade misturada Erick Muzart Fonseca Alexandre Zaghetto
dos Santos 107 O porqu de
Aroldo Cedraz
Francisco Osrio Ramos 53 InfoSAS: um sistema governana de dados
de minerao de em organizaes
24 Plataforma de servios dados para controle de controle
de dados abertos do da produo do SUS
TCU: crowdsourcing, Ricardo Dantas Stumpf
nuvem cvica e Osvaldo Carvalho
aplicativos cvicos 117 O georreferenciamento
Marcos Prates dos bens imveis
Raquel Minardi pblicos no
Monique Louise Monteiro Wagner Meira Jr.
Remis Balaniuk sistema geodsico
Renato M. Assuno brasileiro para fins
Marcelo Pacote Jos Nagib Cotrim rabe de incorporao no
32 A recuperao 61 Aplicativos de cadastro tcnico
semntica da auditoria: uma multifinalitrio:
informao no contexto ferramenta eficaz para construo da
do controle externo assegurao de compras regularizao imobiliria
governamentais dos municpios
Mrcia Martins de
Arajo Altounian Qiao Li Davi Lopes Silva
Beatriz Pinheiro Jun Dai
de Melo Gomes 125 Uso de tcnicas de
71 Modelagem de dados inteligncia artificial
43 Geotecnologias e geogrficos para para subsidiar aes
o monitoramento definio de corredores de controle
dos Objetivos de alternativos no rodoanel
Desenvolvimento da regio metropolitana Lus Andr Dutra e Silva
Sustentvel pelas de Belo Horizonte:
Entidades de cenrios comparativos
Fiscalizao Superior
As inovaes
tecnolgicas na
fiscalizao
Vincius Magalhes
Setembro/Dezembro 2016 7
Entrevista // Nonononono
h dez anos, cruzar dados obtidos nencial, nos leva terrvel armadilha
de diversas fontes, que variam de de subestimar o impacto das trans-
bases de dados convencionais a redes
sociais, onde todos ns deixamos
Todos os rgos formaes. Um exemplo de como a
mudana exponencial subestimada
nossas pegadas digitais. Os cidados de governo podem e foi o Human Genome Project. Foi lan-
esto mais empoderados e com seus ado em 1990, com estimativa de ser
smartphones esto conectados a concludo em 15 anos a um custo de
milhares de outros atravs de redes
devem estar conectados, US$ 6 bilhes. Em 1997, metade do
sociais, compartilhando seus pontos prazo, apenas 1% do genoma huma-
de vista, opinies e comentrios. enviando informaes no tinha sido sequenciado. Pelo pla-
Assim, alm de tecnologias mais nejamento linear que ns adotamos,
baratas e disponveis, as aes de continuamente. Por que supondo 1% em 7 anos, levaramos
fiscalizao podem contar com a 700 anos para concluir o sequencia-
colaborao da prpria sociedade. esperar semanas e meses mento. Parece lgico, no? A presso
para encerrar o projeto foi imensa,
Quais as tecnologias que o senhor mas quando perguntaram ao futurista
classificaria como mais importantes
para analisar dados, se esses Ray Kurzweil, ele disse 1% significa
para o Controle Externo? Por qu? metade do caminho. Vo em frente!.
Algumas tecnologias como a puderem ser analisados Ele pensou exponencialmente. 1%
Internet e os smartphones permitem dobrando a cada ano significa che-
acesso rpido e fcil a qualquer mo-
mento. Todos os rgos de governo
de forma contnua? gar aos 100% em 7 anos. O projeto
foi concludo em 2001, quatro anos
podem e devem estar conectados, en- antes do planejado e custando muito
viando informaes continuamente. o) por 25%, quando considerando menos dinheiro que o estimado. O
Por que esperar semanas e meses para o sucesso da contratao, ou seja, o pensamento linear, tradicional, errou
analisar dados, se esses puderem ser acerto da contratao do novo fun- o alvo por 696 anos! Muitas vezes o
analisados de forma contnua? As cionrio na empresa. Com o uso de pensar fora da caixa insuficiente,
aes tero efeito muito mais imedia- algoritmos preditivos, podemos no pois a caixa ainda nos prende a uma
to. As anlises podem ser muito mais apenas nos contentar com descrio fonte de referncia, limitando o pen-
eficazes se usarmos algoritmos e in- e anlise de fatos passados, mas fazer samento inovador...
teligncia artificial. Alis, algoritmos predies de comportamento de r-
j esto em toda parte, de recomen- gos pblicos baseadas nos padres O envolvimento do cidado nas anli-
dao de livros e filmes deteco observados at o momento. ses e decises tomadas pelo governo
de fraudes por operadoras de cartes parece ser uma abordagem que veio
de crdito. Estamos imersos em um Na sua opinio, qual o maior obst- para ficar. Hoje em dia essa partici-
oceano de dados, e pouco uso faze- culo quando se quer introduzir ino- pao , inclusive, considerada ele-
mos deles. Estimativas apontam que vaes tecnolgicas no ambiente de mento essencial em uma democracia.
em 2020 estaremos criando em todo trabalho? As barreiras culturais ou as Quais as ferramentas tecnolgicas
o planeta 73,5 zettabytes de dados ou limitaes financeiras? Por qu? que voc considera mais eficazes na
73 seguido de 21 zeros! Os resultados Existem, claro, as limitaes finan- promoo do dilogo entre as insti-
da aplicao de algoritmos mostram ceiras, mas o custo da tecnologia vem tuies pblicas e a sociedade?
que se conseguem bons resultados caindo e continuar caindo de forma As redes sociais j fazem parte do
em praticamente qualquer situao. expressiva. Hoje, por cerca de cem dia a dia de grande parte da sociedade
Por exemplo, um estudo efetuado nos reais, compram-se dispositivos de ar- e esse nmero tende a aumentar. Se
EUA, pela American Psychological mazenamento de um terabyte (um observarmos de perto esse fenme-
Association, analisando 17 casos de trilho de bytes) que custavam cen- no constatamos que a Internet e as
estudo de prticas de contratao por tenas de milhares de reais h pouco redes sociais podem ser vistas como
grandes empresas, mostrou que o uso mais de dez anos. A grande barreira tecnologias cognitivas descentraliza-
de algoritmos vencia as melhores pr- a cultural. O nosso pensar de forma doras, onde mais e mais pessoas po-
ticas (geralmente baseadas na intui- linear, quando a evoluo expo- dem emitir suas ideias e opinies de
No existe mais o controle centraliza- Temos que seguir alguns passos.
do dos canais de distribuio de ideias at o momento. Primeiro essencial ter um patroci-
e as trocas horizontais substituem o nador de alto nvel na organizao.
modelo vertical e centralizado. No pode ser uma ao limitada a
presenta a opinio das pessoas que determinada rea ou restrita ao setor
Nos ltimos anos, a atividade de fis- trabalham fora. Podem ter um ponto de TI. Depois, definir claramente os
calizao migrou de falta de informa- de vista bem diferente das que podem objetivos de negcio, que problemas
o para abundncia de dados. Qual atender o telefone domstico durante as iniciativas de anlise massiva de
o caminho mais vivel para uma o dia. Alm disso, se quisermos deta- dados iro resolver? Um fator funda-
instituio - cuja atividade principal lhar um pouco mais a pesquisa, um mental: a equipe. Dificilmente con-
depende da anlise de informao universo de amostras pequeno, como seguiremos pessoas que atendam
identificar os melhores dados e de- fazemos hoje, no ter representativi- equao hackers + profundos conhe-
cidir como us-los/interpret-los? dade estatstica. cimento estatsticos e matemticos
A imensa disponibilidade de da- + bons conhecimento de negcio.
dos embute mudanas na maneira de Qual seria um bom exemplo disso? Uma sugesto montar uma equipe
pensarmos dados. Quando samos do As pesquisas de inteno de voto. multidisciplinar e operacionalizar os
pensamento baseado na escassez para Geralmente pegam-se umas duas mil processos que envolvam os proje-
abundncia de dados, devemos pensar pessoas e tem-se um quadro geral. tos de anlise de dados. Claro que
diferente. Pela dificuldade e limitao Mas se quisermos detalhar ao ponto a equipe deve ter um bom gestor,
tecnolgica que existia, ns acabamos de querermos saber a inteno de que consiga entender as diversas
construindo um modelo mental de es- jovens entre 18 e 25 anos do estado linguagens faladas por profissionais
cassez de dados. Com isso refinamos da Paraba, a amostragem ser insu- to diferentes entre si e que seja
uma srie de prticas como anlises ficiente. Estamos presos s perguntas apaixonado pelo conceito de anali-
estatsticas por amostragem. A partir iniciais e no podemos sair delas. Mas sar dados. Um gerente burocrata no
de uma pequena amostra de dados, com volumes grandes o pensamento vai conseguir desfiar os inevitveis
extrapolamos para um cenrio mais outro. Quando a varivel passa a problemas de comunicao inter e
amplo. Com o tempo refinamos os ser N=todos podemos fazer gra- intra equipe. E montar uma equipe
modelos e hoje eles so bastante confi- nulaes inimaginveis no modelo apenas com hackers, por exemplo,
veis. Entretanto, h algumas lacunas. de escassez. Podemos identificar pode gerar um algoritmo preditivo
A preciso depende muito da amos- tendncias e descobrir correlaes sensacional, mas de pouco valor para
tragem. Por exemplo, uma pesquisa no pensadas antes. Podemos fazer a organizao. Afinal, o objetivo no
de opinio baseada em uma amostra novas perguntas e descer a novos gerar modelos analticos fantsti-
randmica de usurios de telefones nveis de segmentao. Samos para cos, mas sim resolver problemas de
fixos embute um vis: se a coleta for um mind set mais oportuno ou seja, negcio, como eficcia e eficincia
feita no horrio de trabalho, quem aproveitamos oportunidades de fa- da fiscalizao. E, finalmente, gover-
vai atender no necessariamente re- zer perguntas no pensadas antes de nana. Pelas caractersticas de lidar
Setembro/Dezembro 2016 9
Entrevista // Nonononono // Entrevista
Setembro/Dezembro 2016 11
Entrevista // Nonononono
Setembro/Dezembro 2016 13
Opinio Os pilares da estratgia de anlise de dados e consumo de informaes no TCU // Opinio
e avanar na direo da instrumentalizao instituies pblicas gozam de caracterizadas pela inovao em um ambiente
dos processos de trabalho com informaes uma estabilidade institucional e de de incerteza. Apresentado por Eric Ries no
necessrias e suficientes para cumprirem a recursos suficientes para executar seu livro Lean Startup, esse precisamente
sua finalidade? as polticas pblicas sob sua respon- o conceito de startup, sobre o qual os pilares
A seguir, apresenta-se trs pilares sabilidade. O ambiente corporativo de fomento ao uso pleno de informaes
inspirados no funcionamento de instituies mundial, pblico e privado, de pelo controle e para o controle esto sendo
pblicas e privadas nacionais e internacionais incerteza, submetido a mudanas sedimentados na estratgia do TCU. Vamos
que tm servido como base da estratgia do constantes e cada vez mais drsticas. aos pilares:
TCU, visando o pleno uso da informao
em prol do controle. A execuo de aes 2. A infalibilidade. preciso reco- I. Governana
coordenadas tem permitido ao TCU avanar nhecer que solues complexas
na utilizao de tcnicas de anlise de dados, esto naturalmente sujeitas falhas Apoio da alta administrao e liderana.
na produo e no consumo de informaes e insucessos. Em determinados Esses costumam ser os viabilizadores mais
teis ao planejamento e execuo das aes ambientes, em especial para as ins- importantes da governana corporativa,
de controle. Acredita-se que os fundamentos tituies pblicas que atuam em por representarem os pr-requisitos para as
aqui apresentados possam ser considerados ambiente altamente regulado, as fa- diretrizes superiores que suportam a misso.
por outros rgos de controle, bem como lhas podem gerar desconforto e, em Sem o claro apoio da alta direo, iniciativas
por qualquer instituio pblica brasileira ltima instncia, responsabilizao. transformadoras no so mais do que boas
que deseje repensar seu funcionamento a A reao a isso se impe na forma de ideias prestes a serem vencidas pelo cansao.
partir do consumo intensivo de informao. inibio ao surgimento de novas ini- Contudo, somente o direcionamento
Duas premissas foram fundamentais ciativas por medo do fracasso. Nesse no basta. preciso que as diretrizes se
para o estabelecimento dos pilares. Ambas contexto, uma nova relao com os transformem em estratgias. No caso do
colidem frontalmente alguns mitos da riscos deve ser estabelecida sem que TCU, que contou com direcionamento
Administrao Pblica e, por essa razo, se afronte, por bvio, o princpio da voltado ao estmulo da utilizao de
podem ser contraintuitivas em uma primeira legalidade ao qual todas as iniciati- informaes para a atividade de controle, a
leitura. Aos mitos: vas pblicas se vinculam. escolha foi a de incentivar a descentralizao
das atividades de anlise de dados para as
1. A estabilidade. H que se ques- Portanto, preciso encontrar solues unidades tcnicas. As secretarias de controle
tionar se, como era (ou ainda que forneam novos produtos e servios externo passaram a capacitar auditores do
) amplamente entendido, as para o bom funcionamento das instituies, seu corpo para iniciar os trabalhos de anlise
Setembro/Dezembro 2016 15
Opinio Os pilares da estratgia de anlise de dados e consumo de informaes no TCU // Opinio
informaes internalizadas a partir de dezenas um custo marginal, prximo de zero. Ou disposio do TCU. No tardar o tempo
de bases de dados oriundas de acordos de seja, o principal objetivo permitir que as em que at mesmo anlises preliminares
cooperao entre instituies da Administrao informaes sejam muito fceis de usar e automticas das evidncias possam por
Pblica Federal e o prprio TCU. tenham baixo custo. que no? ser entregues ao auditor, de forma
No intuito de se consolidar como uma O ponto que, por mais que tenhamos a subsidi-lo no seu trabalho de avaliao.
plataforma colaborativa de fato, o Labcontas equipes qualificadas e dados a nossa O reconhecimento da importncia
tambm utilizado por parceiros externos, disposio, se o intuito fomentar o da utilizao plena das informaes nas
principalmente tribunais de contas estaduais ecossistema interno e externo de consumo instituies pblicas de controle um fato,
(TCEs). Atualmente, j existem 25 desses de informaes, preciso construir solues mas que carrega consigo muitas dvidas. A
parceiros, sendo 20 TCEs, que utilizam que resolvam o problema (seja planejar maturidade heterognea das organizaes e
os softwares e as informaes pblicas da uma fiscalizao ou ter insumos para o passivo de problemas que afeta o seu pleno
plataforma e, em contrapartida, contribuem responsabilizar ou no determinado gestor) funcionamento tornam qualquer estratgia
trazendo informaes pblicas sobre o de maneira muito simples, na viso daquele de mudana na forma de trabalhar muito
funcionamento de instituies de sua que usar esse insumo para tomar decises. desafiadora. Contudo, as exigncias atuais
jurisdio e de interesse mtuo dos parceiros Mesmo que as solues utilizem algoritmos no nos parecem fornecer alternativas a no
de controle (contrataes de determinado complexos baseados em aprendizado de ser adentrar na realidade que se impe da
estado da federao, por exemplo). mquina e processamento cognitivo ou quarta revoluo industrial, do pensar digital,
A existncia de um ponto central que tcnicas mais recentes de indexao e clculo em que o consumo de bens e servios
congrega informaes e softwares para de relevncia do contedo, o que deve caracterizado pela exigncia do baixo custo
todos os seus profissionais colaboradores importar para o auditor so os resultados que e da qualidade. E esses desejos da sociedade
primordial para que os trabalhos de anlise se obtm desses produtos e o quo confiveis afloram e, cada vez mais, so direcionados
de dados e consumo de informao sejam eles so para cada propsito. para o funcionamento do Estado.
mais eficientes. O recente estmulo abertura No mbito do TCU, cabe citar o DGI A necessidade de se moldar a essa nova
de dados no poder pblico, consubstanciado Consultas, soluo que prov uma interface realidade impe aos profissionais pblicos,
com a publicao de normas que apoiam de busca s informaes custodiadas e alm de uma anlise crtica sobre o senso
a troca de informaes entre os rgos produzidas pelo TCU de maneira simples e comum do funcionamento das organizaes
pblicos (vide Decreto 8.789/2016) e direta e que exemplifica o modo como um pblicas, uma honesta reflexo sobre seu
somado ao aumento na quantidade das grande volume de informaes pode ser papel enquanto parte de uma organizao
informaes disponveis (nem sempre de acessado por auditores de maneira muito que nunca estar suficientemente pronta, mas
qualidade), sugere o surgimento de iniciativas simples e em prol do seu trabalho cotidiano. que precisa entregar mais e funcionar melhor.
estruturantes visando a construo de uma Inspirado nesse exemplo e viabilizado a partir De modo pragmtico, j possvel
plataforma aberta de dados pblicos do Estado, de uma cooperao com o Ministrio da constatar bons resultados oriundos da
voltada anlise avanada de informaes Transparncia, Fiscalizao e Controladoria- execuo da estratgia de utilizao
por parte das organizaes pblicas e que Geral da Unio, o ALICE (Analisador de de informaes e anlise de dados nos
serviria como ponto de contato para as Licitaes, Contratos e Editais) produz e envia processos de trabalho do TCU. Afora os
iniciativas tanto no mbito das aes de mensagens eletrnicas automticas contendo alarmismos de tempos em tempos, mas
controle como na inteno de se transformar um apontamento de riscos sobre as licitaes mantendo viva a capacidade de se inspirar
em instrumento efetivo de gesto. publicadas no dia anterior, considerando e se comparar a uma realidade global e
Com o ambiente pronto, informaes aspectos como os valores envolvidos e indcios local, no h alternativa seno o constante
disponveis e estrutura montada, hora dos de irregularidades obtidos diretamente dos repensar a maneira como a misso das
produtos. textos dos editais em comparao com a instituies pblicas deve ser plenamente
jurisprudncia do TCU. cumprida. O aumento desejado da
III. Solues baseadas em informao Esses so dois exemplos de solues eficincia e da efetividade certamente
baseadas em informao que servem como envolve o pleno uso da informao, que
As organizaes globais que mais uma ferramenta de apoio aos processos demanda o envolvimento e o aumento
consolidaram seu funcionamento a partir de planejamento baseados em risco, alm da interao entre profissionais de perfis
de produo e consumo de informaes de fornecer insumos relevantes durante a complementares, a utilizao de novas
possuem verdadeira neurose em tentar execuo de fiscalizaes e instrues de tecnologias, a gesto das informaes e,
manter as suas informaes prontas para processos por meio da utilizao abrangente principalmente, uma mudana no modo de
uso da maneira mais simples possvel e a das informaes internas e externas planejar e executar os processos de trabalho.
Maio/Agosto 2016 17
Artigos
retranca imagem
podem percorrer vrios locais de Marte, reconstrudos a o campo de pesquisa da realidade virtual tem utilizado
partir de imagens reais enviadas para a Terra pelo veculo HMDs como dispositivos essenciais de exibio visual.
Curiosity, um jipe rob motorizado que explora a superfcie
do planeta vermelho desde agosto de 2012 (Ibid., 2016).
Figura 1:
Destination: Mars uma adaptao do projeto OnSi-
Dispositivo de vdeo HMD
ght, uma ferramenta de software para misses em Marte.
Os dados e imagens transmitidos diariamente pelo veculo
Curiosity so captados na Terra por trs antenas gigantes de
80m, sendo utilizado um dispositivo de realidade misturada
para transportar essas informaes da superfcie de Marte
at um laboratrio na Terra. Os cientistas so envolvidos
pelas imagens captadas nas proximidades do veculo em
Marte, podendo passear em torno de superfcies rochosas
ou agachar-se para examinar formaes geolgicas de dife-
rentes ngulos. O OnSight fornece aos cientistas um meio
de planejar e, juntamente com o veculo Curiosity, conduzir
operaes em Marte, explorando o planeta diretamente de
seus escritrios em Pasadena, na Califrnia (Ibid., 2016).
Setembro/Dezembro 2016 19
Artigos
palavras, trata-se de um termo genrico, aplicvel a todos Modernamente, admite-se que as realidades virtu-
os tipos de experincias imersivas, criadas usando somen- al, aumentada e misturada podem ser reunidas sob uma
te contedo do mundo real, sinttico, ou um hbrido de denominao mais genrica: realidade digital.
ambos (LACKEY; SHUMAKER, 2016). So exemplos de
culos de realidade virtual o Oculus Rift, do Facebook; o 3. NVEL DE DETALHE E RENDERIZAO
Gear VR, da Samsung; e o Projeto Morpheus, da Sony.
Ainda segundo Lackey e Shumaker (2016), realidade A viso estereoscpica por computador (stereovision)
aumentada uma viso direta ou indireta de um ambien- consiste na extrao de informao 3D de imagens, como
te fsico do mundo real, cujos elementos so aumentados aquelas obtidas por uma cmera digital. Comparando a
ou suplementados com entradas geradas por sensores, tais cena a partir de dois pontos selecionados, a informao 3D
como som, vdeo, grficos ou dados de GPS. Trata-se de pode ser extrada a partir do exame das posies relativas
uma sobreposio de contedo sinttico sobre o mundo de objetos nos dois cenrios. As informaes detectadas a
real, em que este contedo no ligado a ele ou mesmo partir destas imagens estereoscpicas so lanadas sobre
parte dele. O contedo de mundo real e o de computao uma superfcie livre, criada com esta finalidade (AKENINE-
grfica no so capazes de interagir um com o outro. Consti- -MLLER; HAINES; HOFFMAN, 2008).
tuem-se em culos de realidade aumentada o Google Glass, Duas cmeras, afastadas horizontalmente uma da
o Daqri Smart Helmet e o Moverio, da Epson. outra, so usadas para obter duas vises diferentes de uma
Realidade misturada, tambm denominada realida- cena, de forma semelhante viso humana binocular.
de hbrida, consiste em uma fuso entre os mundos real Comparando estas duas imagens, a informao de profun-
e virtual para produzir novos ambientes e visualizaes, didade relativa pode ser obtida na forma de um mapa de
onde objetos fsicos e digitais coexistem e interagem em disparidade (disparity map), que codifica a diferena entre
tempo real. Trata-se de uma sobreposio de contedo sin- as coordenadas horizontais de pontos correspondentes
ttico sobre o mundo real do usurio, ligado a ele ou que nas imagens. Os valores neste mapa de disparidade so
com ele interage (Ibid., 2016). Contam-se entre os culos inversamente proporcionais profundidade da cena na
de realidade misturada o HoloLens, o Canon MREAL Dis- localizao correspondente dos pixels (Ibid., 2008).
play MD-10 e o Magic Leap. Utilizando a viso estereoscpica por computador,
para cada imagem que chega ao HMD do observador, ge-
rado um modelo 3D completamente novo por meio de algo-
ritmos automticos que constroem um modelo matemtica e
estatisticamente acurado da superfcie analisada, denomina-
do correlao estereoscpica (COLANER, 2016). Observan-
do duas imagens, encontrando as diferenas entre elas com
auxlio de um mapa de disparidade e usando um modelo
especfico de cmera, conclui-se quo distante cada ponto
se encontra e geram-se os mapas de alcance destas imagens.
Com a finalidade de acelerar o processamento das
imagens tratadas, todos os objetos que se encontram fora
do campo de viso do observador so removidos no pro-
cesso de renderizao (processo de gerar uma imagem a
partir de um modelo 2D ou 3D por meio de processamento
digital, consistindo em trs etapas bsicas: determinao
da cmera virtual, da superfcie visvel e das fontes de luz).
Somente os pixels que so visveis no frustum necessitam
ser renderizados. Todos os objetos que so visveis a par-
tir de um ponto em particular so pr-computados, sendo
imediatamente removidos todos os objetos no visveis,
reduzindo-se dessa forma, o nmero de objetos que inter-
ceptam o frustum (Ibid., 2016).
Frustum o campo de viso a partir do olho do ob-
servador, podendo ser representado por um volume espa-
cial imaginrio contendo tudo o que visvel em uma cena Segundo Lengyel (2004), organizar a geometria em
tridimensional. Pode ser representado por uma pirmide um quadtree traz o benefcio de que sempre que um n da
truncada constituda por seis planos. Quatro desses planos rvore puder ser determinado como no visvel, tem-se a
correspondem aos lados da tela, sendo chamados de frus- informao imediata de que todos os sub-ns daquele so
tum direito, esquerdo, de base e de topo. Os dois planos tambm no visveis e podem ser eliminados, melhorando
restantes so chamados planos frustum prximo e distante, o gerenciamento do nvel de detalhe.
e definem as distncias mnima e mxima em que os ob-
jetos de uma cena so visveis para o observador (DUNN; 4. O MOTOR DE JOGOS
PARBERRY, 2002). A figura 2 ilustra a geometria do frustum.
Para gerenciar o nvel de detalhe, a superfcie da Um motor para criao de jogos digitais como o
cena dividida em ladrilhos ou tiles de diferentes tama- Unity gera o software para integrao com o hardware
1
nhos, cada um com um determinado nvel de detalhe, se- envolvido, mostrando-se adequado para a interao do
guindo uma diviso da superfcie (espao 2D) conhecida usurio com a realidade misturada, visto que os culos
como quadtree (COLANER, 2016). disponveis possuem uma interface com o referido motor.
O quadtree consiste em uma estrutura de dados Utiliza-se um frame rate de 60 fps (quadros por segundo).
em rvore, na qual cada n interno possui exatamente Frame rate a frequncia (rate) com que um dispositivo de
quatro filhos, sendo utilizada para particionar um es- processamento de imagens as exibe de forma consecutiva,
pao bidimensional (2D), por exemplo, uma superfcie sendo estas chamadas de frames (quadros).
mediante subdiviso recursiva em quatro quadrantes, O motor de jogos Unity emprega a tcnica de mip-
regies ou clulas adaptveis. Cada clula ou reserva- maps, que consistem em sequncias de texturas do mun-
trio possui uma capacidade mxima. Quando esta ca- do 3D otimizadas e pr-calculadas, sendo cada uma delas
pacidade atingida, o reservatrio sofre uma diviso. A uma representao em resoluo progressivamente mais
estrutura da rvore segue a decomposio espacial do baixa da mesma textura, o que incrementa a velocidade
quadtree, ou seja, cada n sofre uma diviso em quatro de renderizao. Texturas mipmaps de alta resoluo so
sub-ns (LENGYEL, 2004). usadas para amostras de alta densidade, como objetos
A figura 3 exibe um quadtree construdo para prximos cmera. Texturas de baixa resoluo so usa-
uma rea contendo um nico objeto. A ilustrao das quando o objeto aparece mais distante. A tcnica de
direita mostra como a estrutura de dados correspon- mipmap pode melhorar o desempenho de processamento
dente organizada. Cada n possui quatro sub-ns. em at 33% no Unity.
Se nenhuma geometria de mundo interceptar um qua- Dessa forma, para os tiles mais prximos do ob-
drante, ento este quadrante no subdividido. Qual- servador, a resoluo torna-se mxima. Para tiles mais
quer quadrante que no contm objetos removido da distantes de seu campo de viso, a resoluo vai dimi-
rvore. Assume-se tambm que quaisquer quadrantes nuindo exponencialmente. Quando o observador dirige
ausentes esto vazios. seu olhar mais para frente, as texturas de resoluo menor
Figura 2: Figura 3:
Geometria do frustum Particionamento de um espao 2D com quadtree
Setembro/Dezembro 2016 21
Artigos
so sobrepostas s texturas de mais alta resoluo. Com at agachar-se para examinar detalhes de diferentes pers-
esta tcnica, imagens locais captadas por cmeras do ve- pectivas e reunir achados de auditoria.
culo Curiosity podem ser combinadas com imagens de Para o caso de fiscalizaes em obras rodovi-
satlites orbitando Marte no local de observao, j que rias, podem ser observados remotamente, utilizando a
estas exibem uma resoluo que constante na regio Auditoria em Realidade MisturadaMRA, os seguintes
(COLANER, 2016). defeitos na rodovia: formao de panelas; afundamen-
Adicionalmente, se o observador clicar em algum tos; escorregamento de aterros; desgaste e fissuras em
detalhe da imagem podem ser exibidas outras imagens revestimentos; dispositivos de drenagem danificados;
com zoom, tomadas de outro ngulo ou mesmo de um exsudao em trecho de curva; remendo; degradao,
satlite orbital. Por seu turno, os culos de realidade ruptura e eroses de borda etc.
misturada (HMDs) suportam olhar fixo (gaze), gestos e No que diz respeito s fiscalizaes em obras
comandos de voz. ferrovirias, a observao visual em MRA pode de-
tectar os seguintes defeitos, tanto nas obras de terra-
5. AUDITORIA EM REALIDADE MISTURADA plenagem e de artes correntes e especiais, quanto na
plataforma ferroviria e na via permanente: apodreci-
A auditoria em realidade misturada consiste na mento; fratura ou excesso de furos em dormentes de
realizao de uma fiscalizao em que o auditor no madeira; queima por patinao; e corroso ou flamba-
est presente no local da obra, encontrando-se distan- gem da via em trilhos de ao. Pode ocorrer ainda des-
te, em outra localidade. Os sinais eletromagnticos, locamento longitudinal dos trilhos (ou arrastamento),
relativos s imagens da superfcie que so captadas desnivelamento nas juntas, desaparecimento de folga
por cmeras digitais no local, so transmitidos para entre eles, ocorrncia de vazio ou bolsa de contrao,
o HMD do auditor que recebe as referidas imagens e bem como o seu desalinhamento.
consegue percorrer a obra virtualmente e em tempo Quanto a fiscalizaes de obras de edificaes
real, mesmo estando a distncia, por exemplo, em com MRA, podem ser verificadas irregularidades na
uma sala na sede do TCU. Assim, auditores do TCU locao da obra (construo da estrutura na posio
podem realizar fiscalizaes de obras em locais dis- incorreta); na terraplenagem (escavao, transporte e
tantes de Braslia sem abandonarem a sede na Capi- aterro); nas fundaes (fissuras nos tubules ou nas sa-
tal Federal. patas); nas estruturas de concreto armado ou protendido
O auditor , portanto, envolvido pelas mltiplas (incorrees nos prumos de cantos externos, pilares e
imagens captadas nas proximidades da obra, todas com poos de elevadores); na alvenaria de vedao (trincas
elevado nvel de detalhe, alm de vrias posies e ngulos ou rachaduras, utilizao de tijolos danificados, locao
diferentes, podendo passear em torno dessa superfcie ou das paredes e dos vos das esquadrias); na cobertura
6. CONCLUSO REFERNCIAS
Este estudo teve como objetivo analisar as tcni- AKENINE-MLLER,T.; HAINES, E.; HOFFMAN, N. Real-Time Rendering.
cas de computao grfica empregadas no projeto On- 3rd ed. Massachusetts: A K Peters; Florida: CRC Press, 2008.
Sight NASA, aplicando-as auditoria de obras pblicas.
Com esteio nesta reconstruo terica, estabeleceram- CANON. MREAL Display MD-10, 2016. Disponvel em: <https://
-se os alicerces de uma nova modalidade de auditoria goo.gl/wBeCih>. Acesso em: 14 set. 2016.
denominada MRA Mixed Reality Auditing, ou auditoria
em realidade misturada. COLANER, S. VR and AR go to Mars: Interview with NASA Scientists
A criao deste novo conceito de auditoria pelo Jeff Norris and Alex Menzies.Toms Hardware, NewYork, April 7, 2016.
Tribunal de Contas da Unio constitui-se em um gran- Disponvel em: <https://goo.gl/gvLN7H>. Acesso em: 14 set. 2016.
de avano no campo da fiscalizao de obras pblicas
e ambiental, com impacto imenso na forma como este DUNN, F.; PARBERRY, I. 3D Math Primer for Graphics and Game
trabalho realizado at o momento, porquanto suprime Development. Texas: Wordware Publishing, Inc., 2002.
as distncias e a necessidade de viagens de especialistas
aos locais de obras e desastres naturais, com evidente eco- JPL.Mixed RealityTechnology Brings Mars to Earth. Jet Propulsion
nomia de tempo e recursos para viagens e hospedagens, LaboratoryNASA, California, March 30, 2016. Disponvel em:
bem como demais despesas concernentes. <https://goo.gl/RYrCrZ>. Acesso em: 14 set. 2016.
As bases lanadas no presente estudo servem
como diretrizes para que o TCU realize parceria com a LACKEY, S.; SHUMAKER, R. Virtual, Augmented and Mixed Reality:
NASA, efetivando projeto conjunto na rea de interesse 8th International Conference on Human-Computer Interaction.
ou mesmo inicie projeto prprio, incluindo o desenvol- 1st ed. New York: Springer, 2016.
vimento do software necessrio, bem como a seleo do
HMD mais adequado e a consequente integrao com LENGYEL, E. Mathematics for 3D Game Programming & Computer
o hardware a ser utilizado. Graphics. 2nd ed. Massachusetts: Charles River Media Group, 2004.
Setembro/Dezembro 2016 23
Artigos
Remis Balaniuk
servidor do Tribunal de Contas da
Unio, ps-doutor em Realidade
Virtual pela Stanford University, doutor
em Informtica pelo Institut National
Polytechnique de Grenoble - Frana,
mestre em Cincias da Computao
pela Universidade Federal do Rio Grande
do Sul e tecnlogo em Processamento
de Dados pela Universidade de Braslia.
Atualmente professor e pesquisador
da Universidade Catlica de Braslia.
retranca imagem
Setembro/Dezembro 2016 25
Artigos
nistrao Financeira do Governo Federal (SIAFI)4, do Ciente desse cenrio, o TCU adotou um modelo
Cadastro Nacional de Empresas (CNE)5, dentre outros. de atuao no ecossistema de dados abertos que assu-
Aps a internalizao das bases, os dados recebi- miu como premissa a necessidade de oferecer aos de-
dos so disponibilizados para a sociedade, por meio de senvolvedores de tecnologias cvicas uma plataforma de
consulta por usurios finais ou por sistemas de software. servios na qual seus aplicativos possam acessar remota-
A seguir, detalhada a metodologia adotada para esta mente dados tratados e atualizados de uma forma mais
disponibilizao dos chamados dados abertos. adequada e otimizada para processamento por sistemas
de software clientes. Outra premissa que a plataforma
2. METODOLOGIA oferecida permita aos aplicativos armazenar os dados
por eles gerados.
Tradicionalmente, ferramentas como o Portal Primeiramente, os dados recebidos a partir das
Brasileiro de Dados Abertos, apesar de sua utilidade, bases citadas na introduo so persistidos em um ban-
tm apresentado como caracterstica principal a dis- co relacional corporativo.
ponibilizao das informaes de forma esttica e/ou Concluda a etapa de persistncia dos dados na
bruta (ex.: planilhas, arquivos em formato XML, CSV ou infraestrutura de armazenamento do TCU, eles esto
HTML), com grande quantidade de registros (ex.: plani- prontos para serem acessados tanto por usurios finais
lhas com dezenas de milhares de linhas ou arquivos com como por aplicativos atravs de web services. Segundo
centenas de megabytes). Porm, dados eletrnicos gover- Erl et al. (2012), a partir de uma perspectiva geral, um
namentais brutos so, em geral, de difcil compreenso servio um programa de software que disponibiliza sua
para o cidado comum. Faz-se necessria, portanto, a funcionalidade por meio de uma interface tcnica publi-
interveno de pessoas, grupos e/ou empresas, com ca- cada, denominada contrato do servio. Considerando que
pacidade e disponibilidade para desenvolver aplicativos tais servios de software podem ser implementados por
e outros elementos tecnolgicos que possam traduzir o meios diversos, utilizaremos neste artigo a denomina-
dado governamental aberto em produtos de interesse e o web service para nos referirmos a servios disponveis
utilidade pblica ou privada. na World Wide Web.
Grande parte dos conjuntos de dados disponi- Cada web service responsvel por agrupar e ex-
bilizados de difcil apropriao tambm pelos desen- por um conjunto de operaes relacionadas. Tais opera-
volvedores de tecnologias cvicas, j que essas bases es podem ser acessadas por aplicaes desenvolvidas
de dados, oferecidas tipicamente em formato bruto, externamente para a obteno dos dados por meio de
comumente tm um baixo valor informativo, alm de protocolos padronizados, de acordo com os padres da
serem disponibilizadas na forma de arquivos estticos. World Wide Web. Tais protocolos incluem, por exem-
Tal caracterstica exige do desenvolvedor um trabalho plo, Hypertext Transfer Protocol (HTTP) (FIELDING et
peridico de transferncia, entendimento, tratamento, al., 1999).
adequao e posterior disponibilizao em aplicativos. A figura 1 mostra o conceito de web service e suas
Tambm requisito comum a necessidade de infraes- operaes em nvel conceitual. Temos dois web services
trutura de TI remota e disponvel continuamente, o que representados e cada um deles responde por determi-
implica em custos de hospedagem (ex.: contratao de nado tema, agrupando operaes de consulta que se-
servios de nuvens) com os quais os desenvolvedores ro executadas sobre a base de dados persistida. Cada
precisam arcar. Tais dificuldades limitam o potencial de operao, por sua vez, admite o recebimento de par-
uso de dados abertos pelos aplicativos cvicos. metros que permitem filtrar, dinamicamente, os crit-
Web service
Web service Escolas Estabelecimentos de sade
Figura 1:
Representao em alto nvel de dois web services. Um agrupa Operaes:
Operaes:
operaes de consulta sobre escolas, e outro, operaes - listar escolas de acordo com
- listar estabelecimentos de acordo
critrios parametrizveis
de consulta sobre estabelecimentos de sade - listar escolas por localizao com critrios parametrizveis
- exibir detalhes de uma - listar estabelecimentos por
determinada escola localizao
- listar avaliaes para - exibir detalhes de um
determinada escola estabelecimento
rios de busca, bem como os atributos e a quantidade de Sade: informaes de especialidades mdicas,
dados retornados. estabelecimentos de sade, profissionais, me-
Com relao ao formato dos dados retornados dicamentos e servios especializados, todos no
pelas operaes, utilizamos JSON JavaScript Object mbito de servios pblicos.
Notation (ECMA, 2013). Tal formato compreensvel
por usurios finais, uma vez que textual. Alm disso, Assistncia social: informaes de centros de
por ser semiestruturado, amplamente utilizado por referncia e centros de referncia especializada
aplicativos para dispositivos mveis e outros tipos de de assistncia social (respectivamente, CRAS e
sistemas computacionais, garantindo ampla interope- CREAS).
rabilidade e facilidade de manipulao por desenvol-
vedores, principalmente em comparao com formatos Empregos: informaes de postos do SINE.
proprietrios, binrios ou de maior complexidade,
comumente encontrados em portais tradicionais de Educao: informaes de educao, incluindo
dados abertos. basicamente dados cadastrais dos estabelecimen-
tos educacionais e de seus recursos.
3. DESENVOLVIMENTO
Denominaremos o conjunto de web services acima
Os web services foram projetados inicialmente citados de nuvem cvica. Daqui em diante, para nos
como ferramenta de apoio para o desenvolvimento de referirmos especificamente ao conjunto de operaes
aplicativos mveis cvicos, no contexto do Projeto BE- definidas no contrato ou interface disponibilizado pe-
PiD (Programa Educacional Brasileiro de Desenvolvi- los web services, utilizaremos o acrnimo API, sigla para
mento para IOS), por meio de uma parceria entre o TCU Application Programming Interface.
e a Universidade Catlica de Braslia (UCB)6. A parceria A API inicialmente proposta e disponibilizada
em questo envolveu o desenvolvimento de aplicativos seguiu os requisitos esperados pelos aplicativos Mapa
cvicos por parte de alunos da referida universidade, que da Sade e Nossa Escola, desenvolvidos por alunos
utilizassem os canais de informao fornecidos pelos da UCB.
web services desenvolvidos pelo TCU. Em virtude principalmente das necessidades de
Foram especificados e desenvolvidos conjuntos coletar feedback de cidados prtica conhecida mun-
de web services para disponibilizao dos seguintes gru- dialmente como crowdsourcing os aplicativos foram
pos de informaes: desenvolvidos seguindo um modelo de rede social, de-
Setembro/Dezembro 2016 27
Artigos
mandando, portanto, a existncia de um cadastro de mento da mquina administrativa pblica, das neces-
usurios e de avaliaes de servios pblicos por eles sidades e da percepo do cidado. O crowdsourcing,
fornecidas. A partir da, surgiu o metamodelo para quando utilizado como uma prtica de transparncia,
aplicativos cvicos, um conjunto adicional de web ser- permite que grandes quantidades de dados ganhem
vices que permite consultar, incluir, alterar e excluir in- sentido, podendo gerar ideias novas para o desenvolvi-
formaes relacionadas a usurios, aplicativos, grupos mento de projetos para sociedade.
de usurios, postagens, hashtags, notificaes etc. Esse conhecimento servir futuramente como
Adicionalmente, para que o mesmo modelo pu- insumo no planejamento de aes de controle do TCU.
desse ser adotado tanto para sade pblica como para Por fim, a coleta e o armazenamento dos dados em um
educao, bem como para outras reas de atuao do formato definido pelo prprio TCU facilita iniciativas
Estado, possvel que usurios enviem avaliaes, sob futuras de anlise estatstica e minerao de dados, tan-
a forma de postagens, de entidades genricas denomi- to preditiva como prescritiva, podendo incluir desde
nadas aqui de objetos. Assim, um usurio pode avaliar anlises mais simples at aplicaes mais complexas
um objeto, que pode ser, por exemplo, uma escola ou baseadas em aprendizado de mquina.
um hospital, a depender do contexto de utilizao de- Como exemplo de aplicativo cvico, as figuras 2 a
terminado pelo aplicativo em uso. 3 mostram capturas de tela do aplicativo Mapa da Sa-
As massas de dados geradas pelo crowdsourcing de, que possui recursos de busca por estabelecimentos
cvico sero fontes inestimveis de informao, em par- de sade em um raio de localizao, exibio de dados
ticular para a concepo de indicadores que permitiro detalhados de cada estabelecimento (incluindo, embora
a descoberta de conhecimento a respeito do funciona- no seja exibido nas capturas, listagem de especialida-
Figura 2: Figura 3:
Mapa da Sade busca de estabelecimentos de sade em Mapa da Sade detalhe de um estabelecimento
raio, exibidos em um mapa (visualizao em modo satlite)
des mdicas e quantitativo de profissionais por funo) exemplo que 456 o identificador da escola
e ainda uma funcionalidade para que o usurio avalie a interno aplicao (ex.: chave em um banco de
qualidade do atendimento prestado. dados);
DELETE: Utilizado para excluir recursos (ex.: ex- 5. CONCLUSO E PERSPECTIVAS FUTURAS
cluir um usurio).
Os aplicativos Mapa da Sade, Nossa Escola,
Exemplos de chamadas a operaes da API que Meu Remdio, Mami e Vacin App constituem exem-
podem ser executadas por aplicativos: plos reais de aplicaes desenvolvidas tendo por base
a API disponibilizada. Esto disponveis nas lojas App
GET <http://contas.tcu.gov.br/nossaEscolaRS/ Store e Google Play.
escolas/123>: recupera as informaes da esco- Em 2016, o TCU promoveu mais uma oportuni-
la identificada externamente pela URL <http:// dade de validar o modelo para aplicativos cvicos aqui
contas.tcu.gov.br/nossaEscolaRS/escolas/123>. descrito: o Desafio de Aplicativos Cvicos8. Trata-se
Considera-se neste exemplo que 123 o iden- de uma hackathon para que desenvolvedores externos
tificador da escola interno aplicao (ex.: chave inscrevam aplicativos que faam uso dos web services
em um banco de dados); disponibilizados.
Na poca em que este artigo foi escrito, o concurso
DELETE <http://contas.tcu.gov.br/appCivicoRS/ estava em andamento, com cerca de noventa aplicativos
pessoas/456>: excluir o usurio identificado ex- inscritos. Ao longo do Desafio, mantivemos um canal
ternamente pela URI <http://contas.tcu.gov.br/ aberto diretamente com os desenvolvedores, atravs de
appCivicoRS/pessoas/456>. Considera-se neste caixa postal institucional e de um site no GitHub9. Por
Setembro/Dezembro 2016 29
Artigos
meio desse canal, recebemos mais de quarenta sugestes Embora tenha sido proposta e implementada pelo
de ajustes e extenses s operaes disponibilizadas pela TCU, a plataforma de web services disponibilizada est
API. A maioria das sugestes foram implementadas, e aberta a contribuies e parcerias. Seu sucesso depende-
algumas encontram-se na lista de melhorias a serem im- r da convergncia de esforos e ideias na construo de
plementadas na prxima verso da API. solues inovadores e teis ao cidado. Se bem-sucedida,
Figura 4:
Exemplo de listagem de web services (metamodelo para aplicativos cvicos)
Figura 5:
Exemplo de listagem de operaes de um web service
Figura 6:
Exemplo de detalhamento de contrato de uma operao
1 Disponvel em: <http://dados.gov.br>. Acesso em: 10 out. 2016. BRASIL. Lei n 12.527, de 18 de novembro de 2011. Dispe
sobre os procedimentos a serem observados pela Unio,
2 Disponvel em: <http://dados.gov.br/dataset/cnes>. Acesso Estados, Distrito Federal e Municpios, com o fim de garantir
em: 10 out. 2016. o acesso a informaes, e d outras providncias. Dirio
Oficial da Unio, Braslia, DF, 18 nov. 2011. Edio extra.
3 Disponvel em: <http://www.comprasgovernamentais.gov.br/
acesso-aos-sistemas/comprasnet-siasg>. Acesso em: 10 out. 2016. ECMA. The JSON Data Interchange Format. Geneva, out. 2013.
Disponvel em: <http://www.ecma-international.org/publications/
4 Disponvel em: <http://www.tesouro.fazenda.gov.br/siafi>. files/ECMA-ST/ECMA-404.pdf>. Acesso em: 10 out. 2016.
Acesso em: 10 out. 2016.
ERL, T. et al. SOA with REST: Principles, Patterns & Constraints
5 Disponvel em: <http://cne.smpe.gov.br/>. Acesso em: 10 out. for Building Enterprise Solutions with REST. New Jersey:
2016. Prentice Hall, 2012. p. 24.
6 Disponvel em: <http://www.bepiducb.com.br/index.html>. FIELDING, R. T. Architectural styles and the design of network-
Acesso em: 10 out. 2016. based software architectures. 2000. Dissertation submitted
in partial satisfaction of the requirements for the degree of
7 Disponvel em: <http://swagger.io/>. Acesso em: 10 out. 2016. Doctor of Philosophy in Information and Computer Science.
University of California, Irvine, 2000.
8 Disponvel em: <http://portal.tcu.gov.br/desafio-aplicativos-
civicos/>. Acesso em: 10 out. 2016. FIELDING, R. et al. Hypertext Transfer Protocol HTTP/1.1.
Junho 1999. Disponvel em: <https://www.w3.org/Protocols/
9 Disponvel em: <https://github.com/>. Acesso em: 10 out. 2016. rfc2616/rfc2616.txt>. Acesso em: 10 out. 2016.
Setembro/Dezembro 2016 31
Artigos
A recuperao semntica
da informao no contexto
do controle externo
1. INTRODUO
retranca imagem
coerentes com sua expresso de busca e, sobretudo, rele- do conhecimento e objetivam solucionar problemas de
vantes para o usurio do sistema. ambiguidade inerentes s palavras usadas cotidianamente.
Efetuar buscas em grandes repositrios de informa- O Vocabulrio de Controle Externo, tesauro do
es no estruturadas e no padronizadas torna-se uma TCU, foi desenvolvido com o objetivo de padronizar o
tarefa rdua, levando muitas vezes a ambiguidades, a con- tratamento de contedos especializados e contribuir com
tedos fora de contexto e at mesmo a no recuperao da a recuperao semntica no contexto do controle externo,
informao desejada. As ferramentas de busca, ao fazerem alm de conferir maior agilidade e preciso s pesquisas nos
uso da linguagem natural, necessitam de conhecimento sistemas de informao do Tribunal.
sobre o significado das expresses utilizadas e das relaes
entre elas, o que possibilita contextualizao e tratamen- 2. SEMNTICA
to de fenmenos lingusticos que afetam a qualidade da
recuperao. O termo semntica, tradicionalmente estudado
Para o processo de classificao e recuperao de in- na lingustica e na filosofia, vem sendo amplamente usa-
formao, vrios mtodos automticos vm sendo desen- do nas mais variadas reas de atuao, especialmente nas
volvidos com o objetivo de obter respostas relevantes para relacionadas tecnologia da informao. A chamada web
qualquer pesquisa realizada. At o momento, a maioria de- semntica (WS), que tem origem na expanso da web e nas
les baseia-se em aspectos sintticos e estatsticos, levando limitaes dos instrumentos de busca baseados em sintaxe,
em considerao frequncia e distribuio de palavras pre- certamente um dos motivos para essa associao.
sentes em documentos. Por se basear nos aspectos sintticos Mas o que semntica? A palavra tem origem no
da informao, a classificao realizada por esses mtodos termo grego semantik, e muitas acepes podem ser encon-
ainda est muito distante, em termos de qualidade, da reali- tradas de acordo com a perspectiva utilizada, pois h, entre
zada com base na indexao dos assuntos dos documentos outras vertentes, semntica textual, cognitiva, lexical, formal
feita por especialistas. e argumentativa. Em geral, todas convergem num mesmo
Recentemente, vm sendo explorados novos mto- ponto: estudam significado, ou significao. A ampla varie-
dos de classificao automtica de documentos baseados dade de possibilidades atesta que o estudo do significado
em aspectos semnticos da linguagem que se referem ao pode ser feito de vrios ngulos.
significado dos termos em seu contexto e finalidade. Uma Trs propriedades bsicas destacam-se na semn-
dessas iniciativas consiste no uso de instrumentos de repre- tica so elas a sinonmia, a antonmia e a polissemia. A
sentao de relacionamentos semnticos e conceituais como sinonmia a diviso da semntica que estuda a relao en-
os tesauros, que se caracterizam por representar domnio tre expresses lingusticas que tm o mesmo sentido. Por
Setembro/Dezembro 2016 33
Artigos
exemplo, garota e menina so palavras substantivas que as particularidades de palavras que, ao contrrio, tm grafia
possuem um mesmo significado, remetendo figura de uma e pronncia semelhantes, mas significados diferentes so
jovem; assim tambm acontece com verbos como renun- exemplos: eminente/iminente e absolver/absorver.
ciar, recusar e rejeitar, que transmitem a ideia de repul- Finalmente, a semntica estuda ainda as proprie-
sa. Ressaltando-se a rara ocorrncia de sinonmia perfeita, dades de denotao e conotao das palavras. Denotao
pode-se afirmar que sinonmia a relao entre palavras a propriedade que uma palavra tem de limitar-se ao seu
e expresses que possuem sentido e significado comuns. prprio conceito por exemplo, o termo estrelas em as
Se por um lado a sinonmia estuda as palavras com sig- estrelas do cu. Conotao a propriedade que uma pala-
nificados semelhantes na lngua, a antonmia trata do estudo vra tem de ampliar-se no seu campo semntico, dentro de
das palavras que indicam sentidos opostos. Na mesma linha um contexto, gerando vrias possibilidades interpretativas
do exemplo anterior, podemos citar os substantivos garota por exemplo, o mesmo termo estrelas em as estrelas
e senhora, bem como os verbos renunciar e aceitar do cinema.
tratam-se todos de termos com significao oposta. Quando transportamos os conceitos aqui explorados
Tambm possvel que uma mesma palavra assu- para o que hoje conhecemos como WS, fica fcil perceber
ma significados diferentes nesse caso, o contexto em que que estamos falando de promover melhorias nos proces-
estiver inserida ditar o seu sentido. Um bom exemplo do sos de representao e recuperao da informao na web.
cotidiano a palavra manga, da qual rapidamente pode- Desde 1990, a web caracterizada por usar linguagens de
mos pensar em duas acepes bastante diferentes: uma fruta marcao que objetivam a apresentao e a leitura por pes-
e uma parte de pea do vesturio. Esse um exemplo co- soas e por mecanismos de busca baseados em algoritmos
mum de polissemia, termo que, formado pelo prefixo poli com orientao sintaxe. O uso da semntica pode ampliar
(muitos) e pelo sufixo semos (significados), a parte a possibilidade de associaes dos documentos a seus sig-
da semntica que estuda as significaes que uma palavra nificados por meio de metadados descritivos. Portanto, a
assume em determinado contexto lingustico. questo do significado na semntica fundamental WS.
H ainda outras duas propriedades semnticas, na Das diversas linhas de estudo relacionadas semn-
mesma linha de estudo da significao, que merecem ser tica, a da semntica formal parece ser a mais pertinente tec-
citadas: a homonmia e a paronmia. A homonmia estuda nologia da informao. Trs aspectos principais permeiam
a relao de duas ou mais palavras que, apesar de terem os estudos sobre semntica formal:
significados diferentes, tm a mesma forma e o mesmo
som o caso de termos como concerto/conserto e rio/rio 1. O princpio da composicionalidade, que estabe-
(substantivo/verbo), entre tantos outros. A paronmia estuda lece que o significado das sentenas depende do
A semntica formal considera ainda o fato de que indexao full-text (ou indexao do texto todo), em
as lnguas naturais so utilizadas para falar sobre objetos, que todos os termos que compem o documento
indivduos, fatos, eventos e propriedades, descritos como fazem parte do ndice;
externos prpria lngua assim, a referencialidade um de
seus aspectos fundamentais. Por essa razo, na semntica indexao por tags (por partes do texto), em que ape-
formal o significado entendido, por um lado, como uma nas algumas partes do texto so escolhidas para gerar
relao com a linguagem, e, por outro, com aquilo sobre o as entradas no ndice (somente as consideradas mais
que a linguagem fala. importantes ou mais caracterizadoras).
A semntica formal procura responder s seguin-
tes perguntas: o que representam ou denotam as ex- As buscas so geralmente feitas atravs de termos
presses lingusticas?, como calculamos o significado fornecidos pelo usurio ou escolhidos por ele entre alguns
de expresses complexas a partir dos significados de apresentados. Esses termos podem significar o assunto ou
suas partes? classe a que pertencem os documentos desejados (na inde-
xao tradicional) ou os termos que devem estar presentes
3. RECUPERAO SEMNTICA nos documentos desejados (nas indexaes full-text e por
DA INFORMAO tags).
Nos sistemas convencionais de busca, as tcnicas
Os sistemas de recuperao de informao (SRI) utilizadas so de base sinttica. Entretanto, quando a busca
procuram representar o contedo dos documentos e apre- do usurio envolve informao cuja relevncia no pode
sent-los ao usurio de maneira a atender rapidamente sua ser dada por palavras-chave, esse modelo no satisfaz. Ob-
necessidade de informao. serva-se, portanto, a crescente explorao das informaes
Para tanto, a RI pesquisa tcnicas para tratamen- semnticas, o que possibilita compreenso dos conceitos
to, organizao e busca de contedos a partir do uso de em seu contexto e finalidade.
padres. As ferramentas de RI, geralmente, trabalham A marcao semntica dos dados na origem um
com tcnicas de indexao capazes de indicar e aces- exemplo das novas tecnologias utilizadas para a RI. A WS
sar rapidamente documentos de um banco de dados tem-se utilizado dessa estratgia para implementar padres
textual. de metadados que adicionem aos dados informaes signifi-
Existem trs tipos principais de indexao: cativas sobre seus contextos, marcando-os semanticamente.
Setembro/Dezembro 2016 35
Artigos
A explorao da semntica intrnseca dos dados bus- As redes neurais, por sua vez, so uma representao
ca fundamentos da lingustica e da cincia da informao que tm muitas caractersticas comuns memria huma-
para ampliar o universo de informaes recuperadas e a na: podem lidar com informao incompleta ou distorcida,
aferio de contextos, por meio do uso de estruturas da permitem generalizaes automticas e exibem contedo
linguagem natural, como os sintagmas verbais e nominais, baseado no contexto. Essas funes possibilitam vrias apli-
e de ferramentas de representao de relacionamentos se- caes na RI guardada na memria humana, essenciais em
mnticos e conceituais. contextos precisos, e so essas aplicaes que se pretendem
Tcnicas de processamento de linguagem natural reproduzir no ambiente computacional.
(PLN) que permitam a construo de algoritmos para a Um componente semntico que impacta o desem-
busca de informao relevante em grande quantidade penho de um SRI o tesauro, ferramenta da linguagem
de documentos esto em crescente demanda. Mtodos artificial de um domnio conhecido, construdo por espe-
eficientes de PLN devem fundamentar-se em conhe- cialistas para representar atravs de conceitos o contedo
cimentos bsicos sobre propriedades da linguagem e informacional, especificando as relaes entre eles. Trata-se
principalmente sobre a semntica dos conceitos. Desse de um sistema de conceitos que se relacionam entre si e so
contexto emerge a ideia de memria semntica, tema que representados por termos.
tem sido objeto de teorias psicolingusticas e uma fonte Cada termo tem obrigatoriamente vinculao com
rica para desenvolvimento de modelos computacionais outro, e essa vinculao que forma a estrutura do tesauro.
que pretendem se aproximar dos processos mentais usa- Os termos so utilizados pelos indexadores no momento
dos pelo crebro humano na compreenso da linguagem. da indexao e devem ser disponibilizados ao usurio no
Alm dos algoritmos, os modelos computacionais neces- momento da RI.
sitam de dados que representam o conhecimento sobre Silveira e Ribeiro-Neto (2004) estudam o uso au-
a linguagem e as associaes de senso comum entre os tomtico de tesauro para melhorar resultados de buscas
conceitos lexicais e suas propriedades. Atualmente, isso na web, por meio de ranking baseado em conceitos que
muito difcil, pois essa tarefa somente pode ser produzida tem sido estudado para a RI em domnios especficos. Em
e verificada por humanos. A memria semntica trabalha experimento realizado pelos autores, os termos de busca
com um lxico mental ou seja, conceitos e unidades de utilizados em um SRI na web foram comparados aos con-
conhecimento e contm informaes sobre as relaes ceitos de um tesauro, utilizado para encontrar conceitos
entre conceitos, formando uma rede conceitual de ele- relacionados. Cada conceito relacionado foi interpretado
mentos conectados uns com outros por diferentes tipos de forma independente e processado separadamente, e en-
de associaes. to combinado em uma rede bayesiana1, para permitir um
ranking final, baseado em conceitos. O objetivo era verificar temente dos outros, o seu permite que se chegue palavra
se a informao acrescida de conceito aumentaria a mdia mais adequada ou que melhor se ajuste s necessidades
da preciso dos resultados da busca. do escritor, sem que, de incio, ele saiba qual ela (GOMES,
No estudo foram utilizadas seis fontes de informa- 1996).
o: palavra chave, conceito, termo especfico, termo geral, Nos anos 1960, o cientista da informao Brian Cam-
termo relacionado e sinnimo. Os autores verificaram, entre pbell Vickery apresentou quatro significados para o termo
outras coisas, que a utilizao de um tesauro especfico para tesauro na literatura de sua rea, sendo que o significado
um domnio especfico fundamental para a melhoria do mais comum o de uma lista alfabtica de palavras, em
desempenho das buscas. que cada palavra seguida de outras relacionadas a ela (VI-
O experimento demonstrou o aumento de 30% na CKERY, 1980 apud MOREIRA; ALVARENGA; OLIVEIRA,
mdia da preciso dos resultados das buscas e, portanto, 2004).
prope a viso de que os tesauros melhoram tanto a revo- Currs (1995, p. 88) define tesauro como uma lin-
cao como a preciso em um SRI. guagem especializada, normalizada, ps-coordenada, usada
com fins documentrios, onde os elementos lingusticos que
4. TESAURO a compem termos, simples ou compostos encontram-se
relacionados entre si sinttica e semanticamente.
De acordo com Moreira, Alvarenga e Oliveira (2004), Tristo (2004, p. 167) o define como vocabulrio
o termo tesauros se origina do grego thesaurs e significa de termos, que nada mais do que uma seleo de termos,
tesouro ou repositrio. Esse termo surgiu com a publicao baseados em anlise de conceitos, na qual se define o termo
do dicionrio analgico de Peter Mark Roget, em Londres, geral, de maior abrangncia, e sua relao com termos mais
em 1852, intitulado Thesaurus of English words and phrases. especficos, que representam os conceitos menores. A Or-
O termo tambm designa vocabulrio, dicionrio ou lxi- ganizao Nacional de Padres de Informao especifica:
co, porm o dicionrio de Roget se diferenciava dos outros
por ser um vocabulrio organizado de acordo com seu sig- Um tesauro um vocabulrio controlado organi-
nificado, e no por ordem alfabtica. A obra teve o mrito zado em uma ordem preestabelecida e estruturado de
de estabelecer a denominao para vocabulrios que rela- modo que os relacionamentos de equivalncia, de ho-
cionam seus termos por meio de algum tipo de relao de mografia, de hierarquia, e de associao entre termos
significado. sejam indicados claramente e identificados por indi-
Em sua introduo, Roget define seu dicionrio cadores de relacionamento padronizados empregados
como uma classificao de ideias e explica que, diferen- reciprocamente. As finalidades primordiais de um te-
Setembro/Dezembro 2016 37
Artigos
sauro so (a) facilitar a recuperao dos documentos lanada no final da dcada de 1970 pela cientista da infor-
e (b) alcanar a consistncia na indexao dos docu- mao Ingetraut Dahlberg, agregando princpios terminol-
mentos escritos ou registrados de outra forma e outros gicos relacionados ao contedo conceitual e sua definio.
tipos, principalmente para sistemas de armazenamen- Para Campos e Gomes (2006), essa uma teoria consolidada
to e de recuperao de informao ps-coordenados. para a determinao do que se entenderia por menor unida-
(ANSI/NISO Z39.19, 2003 apud SALES; CAF, 2008). de em um tesauro: o conceito representado por um termo.
Alm disso, Moreira (2003) aponta como inovao o uso de
Conforme Campos e Gomes (2006), a evoluo na definies para o posicionamento do conceito no sistema.
construo de tesauros baseia-se em duas vertentes, a ame- Brscher (2010) aponta como funo dos tesauros a
ricana e a europeia. Os tesauros elaborados nos Estados traduo da linguagem dos documentos, dos indexadores
Unidos a partir da dcada de 1950 foram fruto do desen- e dos pesquisadores a uma linguagem controlada, usada na
volvimento ocorrido a partir do cabealho de assuntos para indexao e na RI em sistemas de informao. Conforme
o unitermo, passando de um sistema pr coordenado para Sales e Caf (2008), o ANSI/NISO Z39.19, de 2003, ressalta
sistemas ps-coordenados. que os tesauros no so utilizados somente pelos especia-
Silva (2008) afirma que na mesma poca, na Inglater- listas da informao no momento da indexao, mas tam-
ra, o Classification Research Group (CRG) a partir da Teo- bm por usurios da informao no momento da busca de
ria da Classificao Facetada, desenvolvida pelo matemtico documentos.
e bibliotecrio indiano Shiyali Ramamrita Ranganathan Segundo Caf e Brscher (2011), nos tesauros as re-
ampliou as categorias de personalidade, matria, energia, laes semnticas so estabelecidas por meio da anlise
espao e tempo (PMEST) e desenvolveu diversas tabelas das caractersticas ou propriedades dos conceitos, as quais
de classificao, dando origem a uma tcnica denominada permitem identificar diferenas e semelhanas que eviden-
Thesaurofacet, que permitiu melhor posicionamento do ciam determinados tipos de relacionamentos. Um termo
conceito no sistema de conceitos em uma dada rea de as- presente em um tesauro pode ser caracterizado de manei-
sunto, por meio do uso de suas categorias. Conjuntamente, ras diferentes dependendo do assunto em questo e tam-
tambm embasaram os tesauros terminolgicos a Teoria da bm do tipo de sistema que se deseja construir. A estrutura
Classificao Facetada, a Teoria do Conceito e alguns prin- dos tesauros compreende trs tipos principais de relaes
cpios terminolgicos. Esses instrumentos tm nas caracte- semnticas para relacionar os termos: a hierarquia, a equi-
rsticas do conceito um elemento essencial para evidenciar valncia e a associao.
as relaes entre os conceitos e seu posicionamento no sis- Nas relaes hierrquicas os termos so organizados
tema, alm de defini-lo. em gnero/espcie. As relaes de equivalncia so de sino-
A citada Teoria do Conceito, voltada para o referente nmia, ou seja, h termos sinnimos presentes no tesauro
e originalmente chamada Teoria Analtica do Conceito, foi e deve-se indicar qual o termo adequado para representar
determinado conceito. As relaes de associao, por sua Relao hierrquica: relacionamento que expri-
vez, apresentam associaes entre os termos, sem especi- me os graus ou os nveis de superordenao e de
ficar qual tipo de relao propriamente existe so apenas subordinao dos termos; o termo superordenado
termos que se relacionam de alguma forma. representa o gnero de que o termo subordinado
Nos tesauros so tratados ainda casos de ambigui- tipo ou espcie.
dade (possibilidade de que uma comunicao lingusti-
ca se preste a mais de uma interpretao) e de polissemia Relao associativa: reunio de conceitos afins que
(possibilidade de que uma palavra comporte mais de um merecem estar relacionados, mas que no esto li-
significado). gados por relacionamentos de equivalncia nem de
hierarquia.
5. VOCABULRIO DE CONTROLE EXTERNO
No VCE, cada termo corresponde a um conceito,
O tesauro do TCU, denominado Vocabulrio de e todos os termos possuem relacionamentos, sendo o re-
Controle Externo (VCE), foi lanado em 2015 e objetiva lacionamento determinado pelo significado do termo. As
ser instrumento de controle terminolgico que possibilite relaes entre termos ajudam a compreender os conceitos
padronizao no tratamento tcnico e maior preciso na especficos de controle externo e de reas correlatas que
recuperao dos contedos presentes nos sistemas de in- compem o tesauro.
formao do TCU. Bem alm de uma lista hierarquizada de palavras,
O inter-relacionamento dos conceitos no VCE o VCE composto de trs partes distintas, mas inter-re-
foi expresso por meio de relaes de trs tipos: de equi- lacionadas. A primeira formada por palavras chave, re-
valncia, hierrquicas e associativas. O objetivo das lativas s reas de atuao do Tribunal, acompanhadas
relaes apresentar os descritores em seu contexto por definies e sinnimos; a segunda, correspondente
semntico. clientela do TCU e s Entidades de Fiscalizao Superiores
(EFS) associadas Organizao Internacional de Entidades
Relao de equivalncia: se termos sinnimos Fiscalizadoras Superiores (Intosai), traz informaes como
ou quase sinnimos so considerados, para efeito histrico, nomes alternativos, CNPJ e instituies afins. A
do vocabulrio, como representando um mesmo terceira parte contempla a toponmia nacional formada
conceito, um deles escolhido como descritor e os pelas regies, mesorregies, unidades federativas e mu-
demais so proibidos. nicpios brasileiros.
Setembro/Dezembro 2016 39
Artigos
O e-Juris uma ferramenta corporativa que faz parte 6.2 BIBLIOTECA DIGITAL DO PORTAL DO TCU
do e-TCU, o qual agrega todos os sistemas de instruo e
controle de processos do Tribunal, contendo a mesma l- Repositrios corporativos de conhecimento pres-
gica, estrutura e apresentao dos demais sistemas de pro- tam-se a disseminar a informao produzida internamente,
cessos. Alm disso, integrado com o portal do TCU, com a permitir o acesso cultura organizacional e a subsidiar a
o sistema corporativo de busca e com outros sistemas do informao transformada em conhecimento. Sendo mais
TCU, como o Sagas e o VCE. As premissas adotadas para que um depsito de documentos, os repositrios podem
o novo sistema foram seletividade, qualidade, relevncia, atuar de forma decisiva, dando suporte ao desenvolvimento
tempestividade e simplicidade. de novos produtos e servios e formao e capacitao
A principal finalidade do e-Juris a divulgao das da fora de trabalho da organizao. Alm disso, costu-
teses relevantes, do ponto de vista jurisprudencial, que fun- mam servir de fonte oficial de informao aos parceiros e
damentaram acrdos do TCU, por meio de publicaes colaboradores, amparar as atividades cotidianas e auxiliar
peridicas (boletins e informativos) e de formao e dispo- o processo decisrio.
nibilizao, para pesquisas e consultas, da base de dados da No TCU, a biblioteca digital um dos repositrios
jurisprudncia do Tribunal. Com isso, o novo sistema unifica corporativos de conhecimento de mais fcil acesso e uti-
processos de trabalho que antes eram feitos separadamente lizao. Desenvolvida para organizar, tratar e disseminar
e sem integrao. informaes que possam gerar novos conhecimentos,
As teses jurisprudenciais relevantes so representa- a biblioteca digital permite a insero de material com
das por enunciados, sob formato de ementa. Os enunciados diversas tipologias documentais. Assim, no mesmo am-
representam precedentes jurisprudenciais, no o entendi- biente possvel encontrar livros, trabalhos acadmicos,
mento ou a jurisprudncia prevalecente do Tribunal sobre apresentaes, cartilhas, peridicos, acordos, contratos,
determinada questo. expedientes e normativos, alm de imagens diversas e
A adoo da indexao pelo e-Juris permite maior outros tipos de recursos. A ferramenta permite que sejam
preciso na recuperao dos enunciados. Alm da previso estabelecidos dois nveis de acesso aos contedos deposi-
de busca por termos sinnimos, o VCE agrega ao sistema tados: possvel permitir o livre acesso a documentos de
a funcionalidade de sugesto de assuntos correlatos a ser carter pblico, da mesma forma que possvel limitar o
acesso a documentos de cunho interno ou que possuam destaque numa era em que produzimos conhecimento por
algum tipo de restrio. meio de variados colaboradores e parceiros: as wikis fer-
A insero de documentos no ambiente realizada ramenta de tecnologia conhecida como software social e
descentralizadamente, e existem gestores de contedo res- desenhada com um conjunto de caractersticas que permi-
ponsveis pela aprovao do que ficar disponvel no repo- tem a criao e a organizao de conhecimento no mundo
sitrio. A biblioteca digital possui tambm um formulrio colaborativo. A utilizao das wikis tem se revelado uma
de entrada de dados que pode ser usado em todo o Tribu- soluo de baixo custo, com alto grau de eficincia, para o
nal. Esse formulrio composto de metadados controlados fomento criao cooperativa de conhecimento dentro das
e possibilita a descrio do contedo, com elementos tais organizaes.
como ttulo, autoria e data. Mais do que isso, requer que os O ambiente wiki a evoluo do conceito de compu-
documentos sejam classificados em uma rvore temtica ter supported cooperative work (CSCW), que surgiu da necessi-
e que os assuntos tratados sejam traduzidos por palavras- dade de que organizaes tenham pessoas trabalhando em
-chave oriundas de um vocabulrio controlado. lugares fsicos diferentes, ao mesmo tempo que precisando
Em outras palavras, a biblioteca digital do TCU cons- alcanar resultados rpidos conjuntamente; ou seja, surgiu
titui-se num repositrio corporativo de conhecimento que para facilitar a comunicao e a produtividade de grupos
exige que as informaes sejam classificadas e indexadas. remotos.
Para a indexao dos contedos, o ambiente est integrado Desde 2009, o TCU utiliza o software livre Media-
ao VCE. Alm disso, como a biblioteca tambm est integra- wiki para gerir uma wiki de controle externo e acesso res-
da ferramenta de pesquisa textual do portal corporativo, trito aos seus servidores. Trata-se de um importante espao
possvel fazer buscas diretamente no portal e recuperar o colaborativo de construo de conhecimento que rene tu-
contedo depositado no ambiente dessa biblioteca. toriais informais e verbetes especializados oriundos do VCE.
A Wiki pode ser acessada e editada por todos os ser-
6.3 SISTEMA ORIENTAR vidores; eles agregam informaes aos verbetes e tutoriais
em tpicos que abrangem norma, legislao e doutrina. A
O Sistema Orientar foi concebido para ser ferramenta Wiki importante ferramenta de gesto do conhecimento,
de orientao, gesto e disseminao do conhecimento sobre na medida em que fornece informaes e documentos teis
controle externo. Ele permite que qualquer servidor do Tribu- ao trabalho cotidiano dos auditores, de acordo com sua rea
nal possa encaminhar perguntas sobre temas pr-seleciona- de atuao, e se configura como um genuno ambiente de
dos de controle externo, tais como auditoria, planejamento, inteligncia coletiva da organizao.
contas anuais, tomada de contas especial, representao,
denncia, solicitao, avaliao de qualidade, cobrana exe- 6.5 FUTURAS APLICAES
cutiva, normas de controle externo e demais procedimentos
processuais, alm de tirar dvidas sobre o sistema Fiscalis. O VCE apresenta ainda potenciais aplicaes em
Aps a seleo do tema, o sistema direciona a per- diversos sistemas de informao do Tribunal. A integrao
gunta para a unidade responsvel pela rea. A partir da cole- da terminologia na ferramenta de busca do portal do TCU,
tnea das perguntas e respostas, cada unidade respondente por meio da adoo do vocabulrio controlado tanto para
cria automaticamente um banco de dados de perguntas mais o tratamento quanto para a busca, fator primordial para o
frequentes (FAQ), que fica armazenado no sistema e dispo- aumento de preciso e rapidez na RI.
nvel para consultas e pesquisas por todos os servidores. Outra possibilidade de uso do VCE como dicio-
Diversas unidades do TCU j foram cadastradas nrio em softwares de indexao automtica de grandes
como unidades respondentes, e o sistema integrado ao volumes de documentos, servindo de parmetro termino-
VCE. A adoo do vocabulrio controlado permite maior lgico na rea de controle externo. Essa funcionalidade j
preciso na recuperao da informao desejada, uma vez foi testada durante o processo de indexao automtica
que so atribudos, tanto s perguntas quanto s respostas, de enunciados, constante em uma prova de conceito para
termos de indexao que representam os assuntos tratados. aquisio de software de data mining e anlise semntica
de dados.
6.4 WIKI DE CONTROLE EXTERNO Em um cenrio ideal, vislumbra-se que o Tribunal
adote padres, a exemplo de metadados de assunto e da
Entre as diversas possibilidades de armazenar o co- ferramenta de controle terminolgico, para garantir a me-
nhecimento de uma instituio, uma em especial merece lhoria do desempenho de seus SRI.
Setembro/Dezembro 2016 41
Artigos
CAF, L.; BRSCHER, M. Organizao do conhecimento: teorias SILVEIRA, M. L.; RIBEIRO-NETO, B. Concept-based ranking: a case study
semnticas como base para estudo e representao de conceitos. in the juridical domain. Information Processing & Management,
Informao & Informao, Londrina, v. 16, n. 3, p. 25 51, jan./jun. 2011. Doha, v. 4, n. 5, p. 791 805, Sept. 2004.
CAMPOS, M. L. A.; GOMES, H. E. Metodologia de elaborao de SOUZA, A. et al. Recuperao semntica de objetos de aprendizagem:
tesauro conceitual: a categorizao como princpio norteador. uma abordagem baseada em tesauros de propsito genrico. In:
Perspectivas em Cincia da Informao, Belo Horizonte, v. 11, n. 3, SIMPSIO BRASILEIRO DE INFORMTICA NA EDUCAO, 19., 2008,
p. 348 359, set./dez. 2006. Uberlndia. Anais Uberlndia: SBIE, 2008. p. 603 612.
CAPRI, D.; GARRIDO, I.; DUARTE, R. Recuperao semntica da SOUZA, A.; ROCHA, R. Sistemas de recuperao de informaes
informao. 2009. Trabalho apresentado como requisito parcial e mecanismos de busca na web: panorama atual e tendncias.
para aprovao na disciplina Recuperao da Informao, Centro Perspectivas em Cincia da Informao, Belo Horizonte, v. 11, n. 2, p.
de Cincias da Educao, Universidade Federal de Santa Catarina, 161 173, maio/ago. 2006. Disponvel em: <http://www.scielo.br/pdf/
Florianpolis, 2009. Disponvel em: <http://pt.slideshare.net/ pci/v11n2/v11n2a02.pdf>. Acesso em: 23 nov. 2016.
doritchka/angel-recuperao-semntica-da-informao>. Acesso em:
23 nov. 2016. SZYMANSKI, J.; DUCH, W. Information retrieval with semantic memory
model. Cognitive Systems Research, Kalamazoo, v. 14, n. 1, p. 84 100,
CURRS, E. Tesauros: linguagens terminolgicas. Braslia, DF: CNPq; Apr. 2012. Disponvel em: <http://ethologie.unige.ch/etho5.10/
Ibict, 1995. themes/semantic.memory/szymanski.duch.2011.information.
retrieval.in.sematic.memory.neural.network.models.pdf>. Acesso
GOMES, H.E. Classificao, tesauro e terminologia; fundamentos em: 23 nov. 2016.
comuns. Rio de Janeiro: UNIRIO, 1996.
Geotecnologias e o monitoramento
dos Objetivos de Desenvolvimento
Sustentvel pelas Entidades
de Fiscalizao Superior
retranca imagem
RESUMO 1. INTRODUO
Setembro/Dezembro 2016 44
Artigos
sas fases da auditoria (INTERNATIONAL ORGANISA- mento, anlise e disponibilizao de informaes geor-
TION OF SUPREME AUDIT INSTITUTIONS, 2013b). referenciadas. Dentre elas tm-se o Global Navigation
No entanto, inexistem nas fontes bibliogrficas Satellite System (GNSS), o Sensoriamento Remoto e os
pesquisadas obras com o objetivo de sistematizar con- Sistemas de Informaes Geogrficas (SIG). O GNSS
juntamente as referncias tcnicas da ONU em relao permitiu s pessoas saberem com preciso a localiza-
ao uso de geotecnologias para o monitoramento dos o delas na superfcie terrestre, destacando-se entre os
ODS e referncias tcnicas da Intosai que abordem o sistemas dessa natureza o Global Positioning System
tema geotecnologias. (GPS) (SOUZA, 2016).
Pelos motivos expostos e visando auxiliar o uso Souza (2016, p. 41) caracteriza o sensoriamen-
de novas tecnologias aplicadas ao controle, este artigo to remoto pela utilizao de sensores para captao
se prope a fazer a reviso da literatura de referncias e registro a distncia, sem contato direto, da energia
tcnicas das Naes Unidas e da Intosai que possam refletida ou absorvida pela superfcie do alvo. A partir
contribuir com o uso de geotecnologias para o monito- da utilizao de programas computacionais possvel
ramento dos ODS pelas EFS. realizar o armazenamento, a manipulao e a anlise
de dados gerados por essa tecnologia. Os veculos a-
2. GEOTECNOLOGIAS COMO reos no tripulados (VANT), pequenas aeronaves no
FERRAMENTAIS DE APOIO AO tripuladas, podem realizar monitoramento por meio de
MONITORAMENTO DOS ODS imagens areas e filmagens (SOUZA, 2016).
Nesse contexto, os SIG so sistemas que re-
As geotecnologias favorecem a abordagem uni- alizam o tratamento computacional de dados geo-
versal e padronizada para o monitoramento de outras grficos (SOUZA, 2016, p. 41). Cmara (2015, p. 2)
informaes relevantes, tais como indicadores econmi- explica que a principal diferena de um SIG para um
cos, educacionais, ambientais e de sade. A informao sistema de informao convencional sua capacidade
geogrfica permite a anlise e a modelagem de dados, de armazenar tanto os atributos descritivos como as
a criao de mapas e a deteco e o monitoramento de geometrias dos diferentes tipos de dados geogrficos.
suas alteraes ao longo do tempo de forma consistente Com os SIG possvel integrar dados de diversas fon-
e padronizada (NAES UNIDAS, 2015a). tes, permitindo a realizao de anlises mais comple-
Souza (2016, p. 40) descreve as geotecnologias xas (SOUZA, 2016). Podem-se inserir, em uma nica
como o conjunto de tecnologias para coleta, processa- base, dados provenientes de diferentes fontes e com-
bin-los, com apoio de algoritmos de manipulao e O relatrio Indicators and a monitoring fra-
anlise (CMARA, 2005). mework for the sustainable development goals (NA-
O documento The millennium development go- ES UNIDAS, 2015c) destacou as oportunidades
als: report 2015 (NAES UNIDAS, 2015e) sintetiza trazidas pela revoluo dos dados, por meio de big data,
os avanos, os desafios e as lies aprendidas durante dados sociais e geofsicos e novas formas de compar-
os quinze anos de monitoramento dos ODM. Ao tratar tilhamento de dados. Alm disso, esse relatrio trouxe
sobre os desafios para o monitoramento, afirma-se que uma srie de exemplos de formas de suporte das geo-
grandes lacunas de dados, dados de baixa qualidade, da- tecnologias aos ODS, conforme demonstra o Anexo 1
dos desatualizados e no desagregados em importantes ao final deste artigo.
dimenses figuram entre os principais desafios. Dentre Autores como Jeffrey Sachs (2012) apontam uma
as iniciativas propostas para superar esses desafios, est srie de diferenas entre os ODM e os ODS, conforme
a utilizao de dados geoespaciais (NAES UNI- detalha no Quadro 1.
DAS, 2015e). No documento Data for development: an ac-
No relatrio A world that counts: mobizing tion plan to finance the data revolution for sustainable
the data revolution for sustainable development (IN- development (OPEN DATA WATCH, 2015, p. 8, tra-
DEPENDENT EXPERT ADVISORY GROUP, 2015), a duo nossa), elaborado pela ONU e pelo Open Data
ONU convoca os pases signatrios da Agenda 2030, Watch, afirma que
as empresas e a sociedade civil a coordenarem esfor-
os com a finalidade de melhorar a disponibilidade, os ODS vo depender mais de observaes geoespaciais
a qualidade, a atualizao e a desagregao das in- e terrestres que os ODM. Imagens de satlite esto cada
formaes, objetivando apoiar a implementao em vez mais disponveis gratuitamente em uma resoluo
todos os nveis. moderada e com custos progressivamente menores
De acordo com o documento Assessing gaps in para fontes de alta resoluo. Dados de satlite tm o
indicator availability and coverage (CASSIDY, 2014), potencial para serem utilizados no monitoramento de
um grande desafio a ser superado refere-se baixa co- mais de 23 indicadores dos ODS em potencial, desde
bertura geral dos indicadores propostos. Quase um ter- a medio da qualidade do ar global at cobertura de
o dos indicadores carece de dados em mais da metade florestas e cultivos, impactos de desastres e recursos
dos pases (SHUANG et al., 2013) e, em mdia, apenas hdricos. Novas imagens via satlite so um exemplo de
46% dos dados foram coletados, o que apresenta um tecnologias emergentes que oferecem oportunidades
desafio internacional no que se refere gerao de dados significativas para uma plataforma de monitoramento
estatsticos (NAES UNIDAS, 2014e). de recursos hdricos.
Quadro 1:
Diferenas entre os Objetivos de Desenvolvimento do Milnio (ODM)
e os Objetivos de Desenvolvimento Sustentvel (ODS)
ODM ODS
Durao 2000-2015 2016-2030
Pontos de controles intermedirios (SACHS, 2012) Ausentes Presentes
Complexidade do monitoramento (INTERNATIONAL ORGANISATION
8 objetivos, 20 metas 17 objetivos, 196 metas
OF SUPREME AUDIT INSTITUTIONS, 2015)
Abrangncia geogrfica (SACHS, 2012) Pases em desenvolvimento Todos os pases signatrios
Negociadas entre os governos; desenvolvimento de sistema de
Formas de monitoramento No definidas previamente
monitoramento
Papel da tecnologia (SACHS, 2012) Secundrio Fundamental
Foco (NAES UNIDAS, 2014e) Alvio da pobreza Desenvolvimento sustentvel em sentido amplo
Setembro/Dezembro 2016 46
Artigos
No h dvidas de que a coleta de dados compre- Das fontes primrias dos indicadores propostos
ende um grande desafio. Por isso, deve-se fazer uso de por esse relatrio (SDSN, 2015), 11% esto relaciona-
novas tecnologias e mtodos disponveis, como aqueles das aos dados sobre meio ambiente, estes que incluem
fornecidos por meio das tecnologias de informao geo- dados geoespaciais. O Quadro 2 mostra as fontes de
grfica e big data (NAES UNIDAS, 2015a). Como h dados primrios para esses indicadores.
cada vez mais dados disponveis, o estudo de mtodos Outro componente da ecologia dos dados remete
com utilizao de bases de dados vem ganhando maior aos princpios-chave para selecionar indicadores de mo-
destaque (FREITAS; DACORSO, 2014). nitoramento global, propostos pelo relatrio Follow-up
Dada a amplitude e complexidade da Agenda and Review of the SDGs: fulfilling our commitments
2030, so necessrios diversos tipos de dados com di- (NAES UNIDAS, 2015b). De acordo com esses prin-
ferentes nveis de cobertura (SUSTAINABLE DEVE- cpios, os indicadores precisam ser: limitados em n-
LOPMENT SOLUTIONS NETWORK, 2015). Nesse mero e em concordncia global (para indicadores de
contexto, cada tipo de dado d sustentao e tambm monitoramento global); simples (por exemplo, indicado-
sustenta os outros tipos. res de uma varivel com implicaes polticas diretas);
Para o monitoramento dos ODS so necess- apresentados com alta frequncia, o que permite moni-
rios a composio e o fomento de um ecossistema de toramento regular, preferencialmente anual; baseados
dados. Por esse motivo, a ONU especifica no relat- em consenso, alinhado com padres internacionais e
rio Data for development: A Needs Assessment for informaes baseadas em sistemas; construdos a partir
SDG Monitoring and Statistical Capacity Develop- de fontes de dados bem estabelecidas; mais desagrega-
ment (SDSN, 2015) a tipologia dos dados, esclarece dos quanto possvel; universais; focados no resultado;
quais so as fontes de dados primrios e estabelece os baseados em dados cientficos; e ter uma boa aproxi-
princpios-chave para a seleo de indicadores de mo- mao (proxy) para questes e condies mais amplas.
nitoramento robustos. Parte integrante da ecologia de dados so as ferra-
A tipologia dos dados refere-se a dados de censo, mentas e metodologias para coleta, anlise e comunica-
registros civis e estatsticas sobre nascimento, pesquisas o dos dados. Essas ferramentas e metodologias esto
domiciliares, pesquisas agrcolas, dados administrativos, intrinsicamente relacionadas aos campos geoespaciais.
estatsticas econmicas e dados sobre meio ambiente, Trata-se da fotogrametria, da cartografia, dos sistemas
incluindo dados geoespaciais. Estes ltimos so cruciais de informao geogrfica (SIG) e anlises geoespaciais,
para determinar indicadores ambientais dos ODS, assim de sensoriamento remoto e da inteligncia geoespacial.
como para anlise desagregada dos indicadores socioe- Desses campos, h alguns que so especialmente
conmicos destes (SDSN, 2015). relevantes para o monitoramento dos ODS pelas EFS:
a cartografia2; os sistemas de informao geogrfica3 e
o sensoriamento remoto4. Esses campos fazem parte
Quadro 2:
do que caracterizamos neste trabalho como geotecno-
Fontes de dados primrios para os indicadores dos ODS logias, ou seja: o conjunto de tecnologias para coleta,
processamento, anlise e disponibilizao de informa-
es georreferenciadas (SOUZA, 2016, p. 40).
Fonte de dados primrios No evento Unleashing the power of Where to
Dados administrativos 33%
make the world a better place: How geographic infor-
Pesquisas domiciliares 26%
mation contributes to achieving the SDGs (NAES
Dados internacionais 13%
Dados sobre meio ambiente (pesquisas agrcolas ou dados
UNIDAS, 2015f), Lawrence Friedl, representando a Na-
11% tional Aeronautics and Space Administration (NASA),
geoespaciais)
Registro civil e estatsticas de nascimento 8% afirmou que os ODS chegaram em um momento de
TBD 6% convergncia privilegiada para aproveitar as potencia-
Pesquisas sobre fora de trabalho 2% lidades dos dados espaciais. A informao geogrfica
Outros dados econmicos 2% um elemento essencial no complexo contexto da im-
Censos Transversal
plementao e monitoramento da Agenda 2030 (Id.,
TOTAL 100%
2015a), sendo mencionada na meta nmero 18 do ODS
Fonte: Sustainable Development Solutions Network (2015, traduo e grifo nosso)
nmero 17, que busca o fortalecimento dos meios de
implementao e a revitalizao da parceria global para
o desenvolvimento sustentvel como uma das fontes Tambm afirma que a depender das especificidades de
relevantes de dados. A meta 17.18 objetiva incenti- cada EFS, pode-se incluir especialistas no processo, seja
var o desenvolvimento de capacidades em pases em por contratao ou por consultoria.
desenvolvimento at 2020, visando ampliar significati- J Auditing forests: guidance for Supreme Audit
vamente a disponibilidade de dados confiveis, atuali- Institutions ((INTERNATIONAL ORGANISATION
zados e de alta qualidade, desagregados, por exemplo, OF SUPREME AUDIT INSTITUTIONS, 2010), elabo-
por localizao geogrfica (Id., 2015c). rado pelo Grupo de Trabalho em Auditoria Ambiental
Ao analisar os indicadores nacionais propostos (WGEA) da Intosai, descreve como as EFS podem utili-
pelo Sistema das Naes Unidas no Brasil (PROGRAMA zar a tecnologia do Sistema de Informao Geogrfica
DAS NAES UNIDAS PARA O DESENVOLVIMEN- (SIG). Ao tratar de aspectos metodolgicos, o documen-
TO, 2015), percebe-se que uma quantidade significativa to afirma que tecnologias computacionais podem ser
desses necessita de desagregao geogrfica. A maio- excepcionalmente teis em auditorias. Dois exemplos
ria dos indicadores propostos utiliza alguma forma de dessas tecnologias so o GPS e o SIG ((INTERNATIO-
desagregao geogrfica e, de acordo com o relatrio NAL ORGANISATION OF SUPREME AUDIT INS-
Acompanhando a Agenda 2030 para o desenvolvimen- TITUTIONS, 2010, p. 9). Dados geogrficos podem
to sustentvel, a desagregao de dados que a nova ser utilizados para diversas finalidades e em diferentes
agenda apresenta um desafio a ser superado. fases da auditoria. O SIG pode ser utilizado na fase de
planejamento e o GPS na fase de execuo como uma
3. REFERNCIAS TCNICAS DA ferramenta de suporte. Dados geogrficos podem ser
INTOSAI QUE ABORDAM O empregados em diversas finalidades, como em dife-
TEMA GEOTECNOLOGIAS rentes fases do planejamento, aplicativos baseados em
redes virias, aplicativos baseados em recursos naturais,
O documento ISSAI 5130 Sustainable develo- anlises panormicas, gesto de instalaes, entre outros
pment: the role of Supreme Audit Institutions (INTER- (INTERNATIONAL ORGANISATION OF SUPREME
NATIONAL ORGANISATION OF SUPREME AUDIT AUDIT INSTITUTIONS, 2010).
INSTITUTIONS, 2004), ao tratar sobre as novas atribui- De acordo com o documento Environmental
es derivadas dos ODS, reconhece que as instituies data: resources and options for Supreme Audit Insti-
precisaro questionar se as metodologias existentes para tutions (INTERNATIONAL ORGANISATION OF
realizar as auditorias so adequadas para esse contexto. SUPREME AUDIT INSTITUTIONS, 2013a) tanto os
Setembro/Dezembro 2016 48
Artigos
gestores pblicos auditados quanto as EFS se benefi- dente aumento em complexidade para se avaliar a base
ciaro do uso de SIG. O referido documento descreve de dados. Por isso, as EFS que consideram a possibilida-
dados geoespaciais separadamente, em uma seo es- de de utilizar esse tipo de dado necessitam investir em
pecfica, por considerar que estes trazem consideraes acesso s ferramentas e tambm no desenvolvimento
nicas para as EFS. Devido a restries oramentrias das competncias tcnicas necessrias.
dos governos, os gestores pblicos sentem-se pressio- No relatrio The 7th survey on environmental
nados a demonstrar resultados, o que os leva a utilizar auditing (Id., 2012), a WGEA apresenta o resultado da
em maior escala dados ambientais para demonstrar que pesquisa respondida por mais de 112 EFS. A pesquisa
seus programas atingiram os objetivos estabelecidos. solicitou que as EFS descrevessem metodologias inova-
Esse tipo de mudana pode afetar como o desempenho doras de trabalho que vinham aplicando em auditorias
medido e como gestores pblicos e EFS avaliam esses ambientais. A tecnologia geoespacial foi o item mais
programas (INTERNATIONAL ORGANISATION OF votado5.
SUPREME AUDIT INSTITUTIONS, 2013a). A ISSAI 5540 (INTERNATIONAL ORGANISA-
O referido documento afirma que fontes de da- TION OF SUPREME AUDIT INSTITUTIONS, 2013b),
dos espaciais podem ser especialmente teis para EFS que aborda questes relacionadas utilizao de dados
quando estas esto realizando a verificao de questes geoespaciais em auditorias de gesto de desastres am-
ambientais que tenham aspecto geogrfico explcito, bientais, afirma que os SIG e o sensoriamento remoto
como reas de proteo ambiental ou identificao de podem fornecer valor agregado a todos os estgios da
reas poludas. Dados geoespaciais so tambm teis auditoria, como demonstra o Quadro 36. Segundo o do-
para selecionar amostras de diferentes locais, para iden- cumento, os SIG podem auxiliar na anlise extensiva e
tificar reas de alto risco e padres nos dados, o que no complexa de dados de diversas formas: apresentar os
seria possvel se estes no tivessem seu componente dados espacialmente, consultar dados por localizao
espacial. As EFS tambm podem utilizar os dados es- espacial, analisar localizaes espaciais e armazenar e vi-
paciais como forma de apresentar seus resultados, tor- sualizar dados em camadas, entre outras. Os SIG permi-
nando-os mais tangveis. tem que os usurios produzam mapas de alta qualidade
Por fim, no Environmental Data: Resources and em qualquer escala, armazenem grande quantidade de
Options for Supreme Audit Institutions (INTOSAI, informaes geogrficas, visualizem dados complexos e
2013a) afirma-se que a utilizao de dados atrelados a produzam novos dados com base nos dados existentes.
informaes geogrficas torna as bases de dados mais A ISSAI 5540 prope um checklist sobre a utiliza-
complexas pela necessidade de se registrar o qu e onde o de informaes geoespaciais em auditorias, repro-
est acontecendo, utilizando-se, para isso, de coorde- duzido integralmente no Quadro 4.
nadas geogrficas. Dessa forma, gera-se uma grande A referida ISSAI tambm afirma que a utilizao
demanda de controle de qualidade, alm do correspon- de informaes geoespaciais e do SIG no setor pblico
Quadro 3:
Aplicao das geotecnologias s diversas fases da auditoria de acordo com a ISSAI 5540
Fonte: Adaptado de International Organisation of Supreme Audit Institutions (2013b, traduo nossa)
Quadro 4:
Checklist sobre utilizao de dados geoespaciais em auditorias
tem crescido por diversas razes. Uma das principais sistematizao subsidie futuros estudos a serem desen-
a extenso e a complexidade da informao, que volvidos no mbito das EFS sobre o tema.
deve ser considerada e analisada enquanto tomam-
-se decises. Muitas decises requerem informaes NOTAS
geoespaciais e os SIG apoiam a anlise desse tipo de
informao. Dentro do contexto de polticas pblicas, 1 Por exemplo, a aplicao de imagens de satlite ou o uso do
as informaes geoespaciais cumprem diversas fun- sensoriamento remoto para aes de controle.
es, como a definio de objetivos, a formulao de
medidas, o monitoramento e a avaliao. Alm disso, 2 Disciplina que se encarrega da concepo, produo, disseminao
so muitas as reas da poltica pblica em que se po- e estudo de mapas tanto como objetos tangveis quanto digitais.
dem utilizar informaes geoespaciais. Exemplos7 de-
las so gesto de recursos naturais, proteo ao meio 3 Qualquer sistema que capture, armazene, administre e visualize
ambiente, economia, educao, segurana e sade ( dados associados localizao.
INTERNATIONAL ORGANISATION OF SUPREME
AUDIT INSTITUTIONS, 2013b). 4 Cincia de mensurar a propriedade de algum objeto ou fenmeno
por um sensor que no tem contato fsico com o objeto/fenmeno
4. CONSIDERAES FINAIS estudado.
Dentre as iniciativas propostas pela ONU para 5 Com a mesma quantidade de votos, compartilhando o primeiro
que os ODS superem os desafios encontrados pelos lugar como metodologia inovadora por essa pesquisa, ficou o uso
Objetivos de Desenvolvimento do Milnio, est a uti- de expertise externa.
lizao de dados geoespaciais (NAES UNIDAS,
2015e). Alm disso, nas Normas Internacionais das IS- 6 Cabe ressaltar as similaridades entre as etapas da auditoria e
SAI (INTERNATIONAL ORGANISATION OF SUPRE- algumas das funes descritas no DACUM Research Chart for
ME AUDIT INSTITUTIONS, 2004) so reconhecidas Geospatial Analyst (capture data, manage data, analyse data,
a importncia da capacitao de seus servidores para produce deriverables). Disponvel em: <http://bit.ly/2gqLhvT>.
atender s novas demandas. Acesso em: 12 jul. 2016.
Este artigo se props a fazer a reviso da litera-
tura sobre as referncias tcnicas das Naes Unidas e 7 O artigo denominado O uso de geotecnologias como uma
da Intosai que pudessem contribuir com a utilizao de nova ferramenta para o controle externo (2015), publicado na
geotecnologias para o monitoramento dos ODS pelas edio n 133 da Revista do TCU, exemplifica oito aplicaes de
Entidades de Fiscalizao Superior. Espera-se que essa geotecnologias das quais o controle pblico pode se beneciar.
Setembro/Dezembro 2016 50
Artigos
Anexo 1:
Exemplos de suporte das geotecnologias aos Objetivos de Desenvolvimento Sustentvel (Naes Unidas, 2015)
FREITAS, R. K. V. de; DACORSO, A. L. R. Inovao aberta na ______. Environmental data: resources and options for
gesto pblica: anlise do plano de ao brasileiro para a supreme audit institutions. 2013a. 64 p. Disponvel em:
Open Government Partnership. Revista de Administrao <http://bit.ly/2gEOStn>. Acesso em: 12 jul. 2016.
Pblica, Rio de Janeiro, v. 48, n. 4, p. 869-888, 2014.
______. ISSAI 5130. Exposure draft. Sustainable on ______. 23e Symposium ONU/INTOSAI. 2015d. 8 p.
development: the role of supreme audit institutions. 2004. Disponvel em: <http://bit.ly/2fJRstI>. Acesso em: 5 jun. 2016.
53 p. Disponvel em: <http://bit.ly/2fcy2Br>. Acesso em: 12
jul. 2016. ______. The millennium development goals report 2015.
2015e. 73 p. Disponvel em: <http://bit.ly/1Rg5uUm>. Acesso
______. ISSAI 5540. Use of geospatial information in auditing em: 5 jul. 2016.
disaster management and disaster-related aid. 2013b. 36 p.
Disponvel em: <http://bit.ly/2glYicn>. Acesso em: 14 jul. ______. Unleashing the power of Where: how geographic
2016. information contributes to achieving the SDGs. 2015f. 24 p.
Disponvel em: <http://bit.ly/2fcsLtH>. Acesso em: 9 jul. 2016.
______. The 7th survey on environmental auditing. 2012.
77 p. Disponvel em: <http://bit.ly/2fvUVOT>. Acesso em: ______. NoTheme I: Sustainable Development Goals.
12 jul. 2016. How INTOSAI can contribute to the UN post 2015 agenda
including good governance in order to strengthen the fight
______. The role of sais and means of implementation for against corruption? Abu Dhabi: Incosai, 2016.
sustainable development (lessons learned from MDGs). 2015.
Disponvel em: <http://bit.ly/2gkLcc0>. Acesso em: 9 jul. OPEN DATA WATCH. Data for development: an action plan
2016. to finance the data revolution for sustainable development.
2015. 81 p. Disponvel em: <http://bit.ly/2fvQaVD>. Acesso
NAES UNIDAS. Ambassador statement: unleash ing the em: 9 jul. 2016.
power of Where to make the world a better place: How
geographic information contributes to achieving the SDGs. P R O G R A M A D A S N A E S U N I D A S PA R A O
2015a. 3 p. Disponvel em: <http://bit.ly/2fJOZ2z>. Acesso DESENVOLVIMENTO. Acompanhando a agenda 2030
em: 5 jul. 2016. para o desenvolvimento sustentvel: subsdios iniciais do
Sistema das Naes Unidas no Brasil sobre a identificao
______. Assessing gaps in indicator availability and coverage. de indicadores nacionais referentes aos Objetivos de
2014. 9 p. Disponvel em: <http://bit.ly/2glULel> Acesso em: Desenvolvimento Sustentvel. Braslia: PNUD, 2015. 250 p.
5 jun. 2016.
SACHS, J. D. From millennium development goals to
______. Follow-up and Review of the SDGs: fulfilling our sustainable development goals. The Lancet, London, v. 379,
commitments. 2015b. 39 p. Disponvel em: <http://bit. p. 2206-2211, 2012.
ly/2fvQkMQ>. Acesso em: 9 jul. 2016.
SUSTAINABLE DEVELOPMENT SOLUTIONS NETWORK. Data
______. Indicators and a monitoring framework for the for development: a needs assessment for SDG monitoring
sustainable development goals: launching a data revolution and statistical capacity development. 2015. 81 p. Disponvel
for the SDGs. 2015c. 225 p. Disponvel em: <http://bit. em: <http://bit.ly/1zeUVcf>. Acesso em: 9 jul. 2016.
ly/1DMsAfp>. Acesso em: 9 jul. 2016.
SHUANG, C. et al. Towards a Post-2015 Framework that
______. Resolution A/66/209. Promoting the efficiency, Counts: Development National Statistical Capacity. 2013.
accountability, effectiveness and transparency of public Disponvel em: <http://bit.ly/2g8V35c>. Acesso em: 9 jul.
administration by strengthening supreme audit institutions. 2016.
2011. Disponvel em: <http://bit.ly/2fctLy9> Acesso em: 5
jul. 2016. SOUZA, A. D. Modelo de controle para obras de esgotamento
sanitrio utilizando sistema de informaes geogrficas.
______. Resolution A/69/228. Promoting and fostering the 2016. Tese (Doutorado em Engenharia Civil) Universidade
efficiency, accountability, effectiveness and transparency Federal de Pernambuco, Recife, 2016.
of public administration by strengthening supreme
audit institutions, 2014a. 3 p. Disponvel em: <http://bit.
ly/2gETHmm>. Acesso em: 5 jun. 2016.
Setembro/Dezembro 2016 52
Artigos
InfoSAS: um sistema de
minerao de dados para
controle da produo do SUS
retranca imagem
Setembro/Dezembro 2016 54
Artigos
a base CNES3, um cadastro de estabelecimentos. O sis- A Figura 1 mostra um exemplo de grfico pre-
tema InfoSAS examina essas bases do SUS e tambm sente em uma folha de fatos. Nele vemos que, para o
dados populacionais fornecidos pelo IBGE, e produz o alvo Tratamento de doenas do aparelho da viso, o
que chamamos de folhas de fatos. atendimento total de Curitiba, no perodo de setembro
As bases de dados referidas so volumosas e es- de 2013 a agosto de 2014, seguiu de perto a expectati-
sas folhas de fatos do foco ao seu exame. Elas relacio- va segundo a mdia brasileira, que este atendimento
nam um alvo de minerao, um perodo de anlise e um superior mdia do Paran, e que o prestador con-
estabelecimento prestador, mostrando grficos e tabelas tribuiu com menos da metade desse atendimento. Es-
obtidas pelo exame das bases de dados. Um alvo de mi- sas so informaes compatveis com uma situao de
nerao um subconjunto da produo do SUS, defini- normalidade.
do por um ou mais procedimentos da Tabela do SUS4, e Mas nem sempre assim. Alguns fatos chamam
algumas vezes tambm pela faixa etria dos pacientes. ateno do profissional de controle. Na Figura 2, diver-
importante observar que fatos presentes nas folhas sos municpios esto com uma taxa de atendimentos
podem tambm ser verificados de forma independente por habitante muito acima da brasileira e da estadu-
consultando outras fontes de informao oferecidas pelo al, e o estabelecimento em questo praticamente o
SUS, como o TabWin5. nico a atender esses municpios. Este um exemplo
claro do que consideramos anomalias ou discrepncias
estatsticas.
Discrepncias estatsticas devem ser considera-
Figura 1:
das com cuidado, como ilustra o exemplo mostrado na
Anlise da participao de um estabelecimento no atendimento de
Curitiba para o alvo Tratamento de doenas do aparelho da viso Figura 3. Cada um dos seis grficos mostrados se refere
a um municpio e todos a um nico prestador. Pode-se
notar que somente o grfico no canto superior esquerdo
(que corresponde ao municpio sede do estabelecimen-
to) no apresenta picos estranhos, com valores muito
acima dos esperados pelas taxas brasileiras e da UF onde
se localizam os municpios. Um indcio de fraude? No.
Quando se nota que o alvo Mamografia e que o
prestador uma unidade mvel, a anomalia estatstica
se explica: o prestador um veculo equipado com um
Figura 2:
Anlise da taxa de atendimento por habitante de 6 municpios atendidos por um
estabelecimento para o alvo Tratamento de doenas do aparelho da viso
Figura 3:
Discrepncias estatsticas explicveis pelas caractersticas do alvo, Mamografia bilateral
para rastreamento, e do prestador, uma Unidade Mvel de Sade da Mulher
mamgrafo que realiza mutires em pequenas cidades, Na Figura 4 temos outros exemplos de discre-
provocando em suas visitas os picos de atendimentos. pncias estatsticas, agora com estabelecimentos pra-
De forma geral, importante observar que uma ticando preos mdios de internao muito superiores
anomalia estatstica pode sim ser um indcio de frau- aos praticados no restante do Brasil para dois alvos de
de, mas tambm pode resultar de processos corretos, minerao. Novamente, preciso que o gestor exami-
como no exemplo acima, ou de informao incorreta, ne com cuidado cada caso de discrepncia estatstica,
ou de epidemias. E tambm possvel que municpios pois possvel que o estabelecimento tenha um perfil
com taxas de atendimento altas sejam, na verdade, os de pacientes com complicaes acima da mdia, ou
poucos bem atendidos no pas. Portanto, a anlise de que utilize prticas que podem elevar o custo da in-
uma folha de fatos deve ser feita com o mximo de dis- ternao, mas que tambm, digamos, diminuam sua
cernimento e por um profissional de sade pblica que taxa de bitos.
conhea o contexto local.
Figura 4:
Anlise do valor cobrado por um estabelecimento para internaes dos alvos Artroplastia total primria do quadril no cimentada/
hbrida, esquerda, e por outro estabelecimento para Cirurgia cardiovascular Cirurgia cardiovascular marcapasso, direita
Setembro/Dezembro 2016 56
Artigos
3. DETECO AUTOMTICA DE
DISCREPNCIAS ESTATSTICAS
bm dados populacionais do IBGE alimentam o servidor nizao dos processos de seleo de itens para auditoria
de minerao de dados, que guiado por uma tabela de e controle. Alm da necessidade de manuteno do sis-
alvos de minerao e que executa algoritmos para detec- tema, constante atualizao, correo e calibragem fina
o de discrepncias estatsticas. Esta fase de minerao dos algoritmos j utilizados, existem muitas linhas para
produz o que ns chamamos de cubo de fatos minerados. desenvolvimentos futuros. Vislumbramos uma nova
Este cubo explorado pelo usurio do InfoSAS, utilizan- interface com visualizao mais flexvel e interativa
do uma ferramenta de BI. O usurio seleciona um modelo dos resultados; uma caracterizao estatstica de alvos
de relatrio e especifica parmetros para filtros por con- com identificao de vazios assistenciais; a utilizao
junto de alvos, perodo de anlise e recortes geogrficos. da populao SUS nos clculos estatsticos; o clculo
Um relatrio produzido de acordo com o modelo esco- de limites inferiores e superiores para a atribuio de
lhido e com os filtros determinados, contendo escores de produo anmala de um municpio a seus prestado-
discrepncia calculados pelos algoritmos de minerao. res; a escolha adaptativa de recortes geogrficos com o
Do relatrio, o usurio extrai para anlises mais aprofun- dimensionamento adequado frequncia de ocorrncia
dadas folhas de fatos que lhe chamam a ateno. de cada alvo; e a utilizao de paralelismo no processa-
mento da minerao e da visualizao.
5. CONCLUSO E TRABALHOS FUTUROS Alm desses, queremos destacar dois desenvol-
vimentos que, a nosso ver, so os mais importantes a
No momento atual (outubro de 2016), o InfoSAS serem feitos. O primeiro destes seria viabilizado pela
est instalado e em funcionamento no DATASUS. Um realizao de auditorias, talvez guiadas por alertas do
curso a distncia para capacitao de gestores quanto InfoSAS, classificando atendimentos um a um como
ao uso do InfoSAS est em preparao, devendo ser fi- fraudulentos ou regulares. Essa rotulao abre a possi-
nalizado at novembro de 2016, com a primeira oferta bilidade de utilizao de algoritmos de aprendizado su-
prevista ainda para este ano. O sistema InfoSAS j foi pervisionado, permitindo a emisso de alertas de forma
apresentado em diversos eventos nacionais (DRAC SAS, mais precisa e elaborada.
2015) e, em todos eles, seus resultados foram julgados O outro consiste em uma anlise consolidada de
muito interessantes por especialistas em sade pblica. anomalias em taxas de atendimentos por habitante. O
Os resultados j obtidos pelo projeto InfoSAS so InfoSAS, em sua verso atual utiliza diversos algoritmos
importantes e representam um passo frente na moder- que procuram capturar anomalias estatsticas. Temos
Figura 5:
Etapas da anlise de dados pelo sistema InfoSAS
Setembro/Dezembro 2016 58
Artigos
tambm uma estrutura de alvos de minerao onde um situarem direita do ponto que divide a rea sob a cur-
alvo pode incluir outros alvos. Com isso, conseguimos va em uma parte normal, com 99% de probabilidade;
muitos achados, mas no temos como classificar esta- e em uma parte anormal, com 1% de probabilidade,
belecimentos pelo conjunto de alvos nem obter estima- o que nos parece um critrio bastante prudente. Para o
tivas globais de valor para produo anmala. exemplo da Figura 7, taxas acima de 3,2 atendimentos
Para produzir um novo relatrio superando es- por 1.000 habitantes/ms so consideradas anormais.
tes problemas, ns decidimos ter como alvos somente Suponhamos que para o alvo em questo, um municpio
conjuntos de procedimentos em uma mesma forma de de 100.000 habitantes tenha recebido 400 atendimentos
organizao da Tabela do SUS, o que faz com que a inter- em um dado ms. Pela taxa limite de 3,2 atendimen-
seo entre dois alvos quaisquer seja vazia, e utilizar um tos/1.000 habitantes, a populao desse municpio de-
nico algoritmo com uma metodologia estatstica para veria ter recebido, no mximo, 320 atendimentos. Ns
estimativa de excessos em taxas de atendimentos por consideramos, ento, que o municpio teve 80 aten-
habitante. Isso torna possvel a obteno de estimativas dimentos anmalos, cujo valor distribudo entre os
globais (em todos os alvos) de produo anmala para prestadores do municpio, mantendo as propores do
cada prestador, o que permite a priorizao da apurao atendimento de cada prestador.
de fatos pelos gestores do SUS. Os resultados da aplicao desta anlise produ-
A metodologia que pretendemos utilizar, e que j o registrada no SUS em 2013 so fortes. De um total
aplicamos a dados de 2013, tem como ponto de partida de R$19.912.491.904,00, foram considerados anormais
a constatao de que a distribuio das taxas de atendi- atendimentos com valor somado de R$413.920.365,56,
mento por habitante observadas nos municpios segue correspondendo a 2,08% do total. O excesso em alvos
uma distribuio log-normal, como ilustrado na Figura registrados no SIHSUS foi de R$350.354.969,25, e no
6. Isso abre a possibilidade de definio para qualquer SIA de R$63.565.396,30.
alvo e para qualquer municpio de um ponto de corte Outro resultado deste estudo que pode ser uti-
para o que deve ser considerado como normal ou anor- lizado para priorizao de auditorias uma anlise da
mal em uma taxa de atendimentos por habitante. distribuio entre prestadores dos atendimentos consi-
Ns arbitramos que taxas de atendimento por derados anmalos. Em todo o Brasil, apenas 5 prestado-
habitante devem ser consideradas anormais quando se res concentram quase 9% do valor total das anomalias;
Figura 6:
Densidade da probabilidade de taxas de atendimento por habitante: log-normal terica vs. dados observados
Figura 7:
Definio da taxa-limite de atendimentos por habitante no ponto de corte de 1% da distribuio log-normal
Setembro/Dezembro 2016 60
Artigos
Qiao Li RESUMO
candidata a doutorado
na Rutgers, a Universidade Recentemente, governos de muitos pases adotaram
Estadual de Nova Jersey, Estados iniciativas de dados abertos com o objetivo de tornar suas
Unidos. O trabalho de pesquisa operaes mais transparentes para os cidados. Com os da-
desenvolvido por Li inclui dos abertos, qualquer um que tenha interesse em monitora-
auditoria analtica, planejamento mento de gastos do governo pode aplicar tecnologias para
e gesto de risco em auditoria, realizar anlises sobre dados de compras pblicas governa-
sistemas para suporte em mentais. Este trabalho prope 29 aplicativos de auditoria
auditoria e aprendizado de que podem ajudar diversas partes interessadas na anlise de
mquina (machine learning). dados governamentais abertos. Esses aplicativos podem aju-
dar a investigar dados de aquisio sob diferentes perspecti-
vas, tais como autenticao das qualificaes do contratante,
Jun Dai deteco de precificao duvidosa etc. Esse artigo usa dados
professora assistente na de contratos de compras do Governo Federal brasileiro para
Southwestern University of Finance ilustrar a funcionalidade desses aplicativos. No entanto, os
and Economics, na China, e aplicativos tambm podem ser utilizados por outras naes
candidata a doutorado na Rutgers, para analisar seus dados governamentais abertos.
a Universidade Estadual de Nova
Jersey, Estados Unidos. O trabalho Palavras-chave: Aplicativos de Auditoria, Anlise
de pesquisa desenvolvido por Dai de Dados, Compras Pblicas Governamentais.
inclui auditoria analtica, automao
em auditoria, aplicativos para 1. INTRODUO
auditoria e blockchain.
De acordo com a Organizao Mundial do Comr-
cio (OMC), contratos pblicos governamentais respondem,
em mdia, por 10% a 15% do Produto Interno Bruto (PIB)
de uma economia (OMC 2015a). Os governos so grandes
compradores de bens e servios e isso os tornam vtimas
frequentes de fraudes em contratos pblicos (Robbins Geller
retranca imagem
Setembro/Dezembro 2016 62
Artigos
de atendimentos de consultas telefnicas abaixou e com isso que esses grupos comecem a trabalhar com dados abertos.
economizaram mais 1 milho de dlares (The Economist 2015). Primeiro, alm de dados abertos do governo, eles podem
No entanto, existem alguns problemas com dados abertos tambm precisar coletar dados teis provenientes de outras
que ainda impedem seu sucesso. Em primeiro lugar, a quali- fontes. Essas fontes podem incluir mdias sociais, notcias, re-
dade dos dados no boa o suficiente. Embora os governos latrios governamentais e relatrios de analistas. difcil para
de muitos pases sejam obrigados a divulgar dados relaciona- as partes interessadas coletar essas informaes e integr-las
dos, o nvel de divulgao varia. Todos os campos de dados com dados abertos governamentais. Um desafio ainda maior
teis so fornecidos? Os detalhes dos dados so adequados? existe em analisar a grande quantidade de dados disponveis.
Existe alguma informao faltando? Estas questes podem Poucas ferramentas analticas foram especificamente concebi-
alterar a eficcia da anlise de dados abertos. Em segundo das para a variedade de usurios que querem investigar dados
lugar, alguns dados abertos no so preparados em um for- governamentais (O'Leary 2015). Embora existam muitos pro-
mato legvel por mquina, como o formato PDF digitalizado gramas de software de anlise de dados gerais sobre o mer-
(que so na verdade fotos). Isto torna a coleta e anlise de cado, a complexidade inerente dessas ferramentas analticas
dados mais difcil. Em terceiro lugar, a quantidade de dados pode impedir a compreenso e a utilizao pelos usurios
enorme. Isto significa que procurar portais de dados aber- do software. Este problema evidente, especialmente, para
tos e extrair informaes relevantes e teis so muitas vezes usurios com conhecimento limitado de auditoria e anlise
uma tarefa rdua. Outro problema que poucos indivduos de dados. Portanto, desenvolver ferramentas de anlise de
possuem habilidades para analisar e interpretar dados e, em dados eficientes e eficazes uma questo crtica.
seguida, aproveitar essas interpretaes ou concluses. Por
fim, dados no publicados podem ser muito valiosos, mas 2.3 APLICATIVOS NA REA DE AUDITORIA
so dificilmente acessveis devido questo da privacidade
de dados (The Economist 2015). Aplicativos de auditoria so rotinas analticas forma-
lizadas, executadas por uma ferramenta informatizada (Dai,
2.2 USURIOS INTERESSADOS EM DADOS ABERTOS Krahel e Vasarhelyi 2014). Cada aplicativo de auditoria geral-
mente executa um teste nico de auditoria analtica, exigindo
As partes interessadas em explorar dados abertos, geralmente poucas interaes do usurio. Os usurios s pre-
identificar anomalias, descobrir irregularidades e detectar cisam carregar dados em aplicativos de auditoria para obter
fraudes incluem, mas esto no limitados a: cidados, im- resultados sem muitas operaes complicadas. Auditores po-
prensa, empresas concorrentes e concorrentes polticos. H dem at mesmo criar aplicativos de auditoria personalizadas
pelo menos dois desafios que devem ser abordados antes que realizam tarefas especiais de auditoria. A popularidade
de aplicativos de auditoria tem crescido recentemente. Isto , necessria orientao para projetar aplicativos
em parte, devido a desenvolvedores de software e provedo- eficientes e eficazes. Propomos uma estrutura que forne-
res de servios de auditoria, que tm feito esforos para criar ce orientao para design de aplicativos para auditorias de
aplicativos de auditoria2. Alguns aplicativos no mercado, no compras governamentais. A estrutura (mostrada na Figu-
entanto, so desenvolvidos especialmente para os cidados ra 1) contm quatro dimenses: tipo de anomalia, tipo de
que pretendem analisar dados abertos do governo. dados, plataforma de software e tcnica.
Aplicativos de auditoria podem estar entre as fer- A primeira dimenso o tipo de anomalia. Anomalias
ramentas favoritas para analisar dados abertos por vrias podem ser classificadas em trs tipos: financeiro, operacional
razes. Uma delas que aplicativos, em geral, podem e relacionadas fraude. Anomalias financeiras referem-se s
ser operadas facilmente com treinamento mnimo. Isso anomalias de dados que podem afetar demonstraes ou rela-
permite que vrias partes interessadas, de vrias reas de trios financeiros governamentais. Estes podem incluir a falta
escolaridade, possam analisar os dados com facilidade. O de dados ou valores incorretos / desatualizados. Anomalias
baixo custo das aplicativos outra razo pela qual elas so operacionais focam na ineficincia das operaes e ativida-
uma opo atraente. A maioria dos usurios so cidados des governamentais. Estas incluem a compra de produtos de
ou empresas concorrentes e no auditores profissionais. luxo para escritrio (como uma cadeira de massagem extre-
Como resultado, difcil para estes comprarem um sof- mamente cara), bens obviamente desnecessrios (como joias)
tware profissional de auditoria caro. Aplicativos de audito- ou bens necessrios com preos significativamente maiores
ria so substitutas com bom custo benefcio que permitem do que a taxa de mercado. Anomalias relacionadas com frau-
aos usurios executar uma grande variedade de testes de de apresentam padres de dados incomuns que podem ser
auditoria com base em anlise. Personalizao outra resultados de fraudes. Por exemplo, se todos os licitantes ofe-
vantagem importante dos aplicativos, porque permite es- recem um preo uniforme e se recusarem a negociar durante
tender aplicativos para cumprir tarefas especficas do usu- o processo de licitao do governo.
rio. Os usurios podem criar aplicativos personalizados A segunda dimenso a plataforma de software.
usando Kits de Desenvolvimento de Software profissional. Esta ser usada para desenvolver e operar aplicativos de
auditoria. Geralmente, existem dois tipos de platafor-
3. UMA ESTRUTURA PARA mas: Software de anlise de dados de auditoria (ADAS)3
PROJETAR APLICATIVOS e Software de anlise de dados generalizados (GDAS)4. O
Figura 1:
Estrutura para projetar
um aplicativo
Tipo de anomalia
Anomalias inanceiras
Anomalias operacionais
Plataforma de Software
Setembro/Dezembro 2016 64
Artigos
ADAS contm funes de auditoria pr-programadas, o ser usadas para localizar processos arriscados de operaes
que torna a criao de aplicativos com base em funes governamentais e identificar potenciais contratos ou transa-
mais fcil. O GDAS geralmente tem a capacidade de ma- es fraudulentas. Os aplicativos devem ser desenvolvidos
nipulao de dados de alto volume, como vrios dados para facilitar as anlises de uma grande variedade de dados.
abertos. O GDAS tambm contm uma grande varieda- A ltima dimenso est relacionada tcnica. Tc-
de de estatsticas e modelos de aprendizagem de mqui- nicas analticas bsicas podem ser usadas para identificar
na, tornando-o til para desenvolvimento de aplicativos. padres incomuns. Tais tcnicas incluem sumarizao,
A desvantagem desse tipo de software que ele requer consulta e correspondncia de dados. Estatsticas descriti-
formao tcnica ou treinamento dos usurios para com- vas podem fornecer uma viso global de dados. Estatsticas
preender os modelos sofisticados. Como cada plataforma (por exemplo, regresso e sries temporais) e aprendizado
de software tem suas caractersticas especiais, os desen- de mquina (por exemplo, agrupamento e classificao)
volvedores podem criar vrias verses de aplicativos que so tcnicas avanadas que podem descobrir efetivamente
permite aos usurios execut-los em diferentes softwares. padres escondidos dentro de dados complexos. Os de-
A terceira dimenso est relacionada ao tipo de da- senvolvedores devem tirar proveito dessas tcnicas para
dos. Recentemente, muitos estudos tm discutido a utiliza- criar aplicativos eficazes e eficientes
o de "big data" para fins de garantia (Vasarhelyi, Kogan e
Tuttle 2015; Cao, Chychyla e Stewart 2015; Yoon, Hoog- 4. PROJETANDO APLICATIVOS PARA
duin e Zhang 2015; Alles 2015). medida que mais pa- AUDITORIA DE DESPESAS PBLICAS
ses e organizaes comeam a abrir seus dados, tais dados
abertos se movero rapidamente para big data (O'Leary Propomos 29 aplicativos que podem ajudar a identificar
2015). Alm disso, outros dados pblicos, tais como artigos potenciais anomalias nas despesas do governo. Essas anomalias
de notcias, mdia social e dados coletados de mquinas ou incluem contratos suspeitos ou a utilizao de fornecedores
vrios sensores podem ser coletados. Todos esses dados no qualificados. A Tabela 1 mostra os aplicativos propostos.
podem ser combinados e usados para identificar anomalias Os trs primeiros aplicativos fornecem uma ve-
ou respaldar investigaes (Vasarhelyi et al. 2015). Ademais, rificao preliminar sobre a confiabilidade e integridade
certas informaes inditas, tais como polticas de opera- dos dados de contratos governamentais. Eles tambm
es internas de certas unidades governamentais, tambm demonstram quaisquer padres de dados especiais. Pa-
podem fornecer esclarecimento quanto a identificao de dres de dados anormais, tais como valores ausentes e
atividades anormais governamentais. Quando integrado flutuao anormal, podem indicar riscos no processo de
com dados pblicos, essas informaes inditas podem contratao. Esses aplicativos fornecem garantia prelimi-
Tabela 1:
Lista de aplicativos propostos
Setembro/Dezembro 2016 66
Artigos
nar de nvel de dados identificando contratos com valores anormais ou desnecessrios, bem como taxas de servios
ausentes ou anormais. Os aplicativos de 4 a 10, auxiliam na no prestados. Isso inclui gastos excessivos em produtos
identificao de fornecedores suspeitos. Visto que forne- para escritrio ou utilizao indevida de fundos pblicos.
cedores podem estar envolvidos em muitos tipos de frau-
des, necessrio desenvolver aplicativos para monitorar 5. ILUSTRAO DE APLICATIVOS
o comportamento dos fornecedores durante os processos UTILIZANDO CONTRATOS FEDERAIS
de licitao e contratao. Esses aplicativos so, portanto, DE COMPRAS BRASILEIRAS
projetadas para identificar fraudes tais como suborno, es-
quemas de comisses e manipulao de preos de licitao. Para demonstrar a utilidade dos aplicativos de audi-
Os aplicativos de 11 a 17 foram projetadas para identificar toria na auditoria de contratos de governo, coletamos dados
padres de preos incomuns. Tendo em vista que contra- de contratos e fornecedores do Sistema Integrado de Admi-
tos arriscados so normalmente associados com preos nistrao de Servios Gerais (SIASG) e do Cadastro Nacional
anormais, esses aplicativos podem chamar a ateno para de Empresas Inidneas e Suspensas (CEIS), de 1989 a 2014. O
contratos de alto risco. Os aplicativos de 18 a 22 podem arquivo de contrato contm, principalmente, informaes so-
ser utilizadas para analisar e monitorar o procedimento bre entidades governamentais, fornecedores de bens e servios,
complexo de licitao. Estes aplicativos podem identificar mtodos de licitaes, datas de incio / trmino e valores iniciais
rapidamente comportamentos suspeitos de licitao, que de contratos. O arquivo de fornecedores registra previamente
pode se caracterizar quando poucos licitantes vlidos par- as empresas para participar de processos de licitao. Os dados
ticipam de uma licitao ou quando uma h uma retirada nesse arquivo incluem o CNPJ das empresas e suas informa-
inexplicvel de uma licitao do processo. Os aplicativos es demogrficas. O sistema CEIS grava o CNPJ das empre-
de 23 a 29 ajudam a identificar as compras de produtos sas que esto proibidas de vender produtos ou servios para o
Figura 2:
Aplicativos de Auditoria para Anlise Descritivas (Adaptado de Dai; Li, 2016)
governo federal brasileiro e inclui a data de incio e trmino de linhas mostra as alteraes em valores totais de contrato ao
suas sanes. Com base nos dados, desenvolvemos oito apli- longo do tempo. Verifica-se um pico em 1999, ano em que
cativos para executar a anlise descritiva, verificao de dados a primeira crise financeira atingiu o Brasil6. Isto indica uma
incompletos e de integridade e identificao de anomalias. preocupao de risco potencial nas despesas pblicas.
Setembro/Dezembro 2016 68
Artigos
as empresas e as agncias governamentais. Um aplicativo 10 Esse aplicativo foi criado pela SAS Enterprise.
foi desenvolvido11 para ajudar a identificar contratos com
fornecedores que no foram pr cadastrados no sistema. Os 11 Esse aplicativo foi criado pela SAS Enterprise.
resultados mostram que 40.942 contratos foram assinados
com fornecedores que no foram registrados no sistema. REFERNCIAS
Mais testes de auditoria precisam ser executados, como,
Alles, M. G. 2015. Drivers of the Use and Facilitators and Obstacles
por exemplo, para analisar se as empresas cobram mais do
of the Evolution of Big Data by the Audit Profession. Accounting
que o preo de mercado e se h uma relao pessoal entre
Horizons, 29(2), pp.439-449.
os gestores das empresas e o rgo do governo etc.
Auer, S. R., C. Bizer, G. Kobilarov, J. Lehmann, R. Cyganiak, and
6. CONCLUSO Z. Ives. 2007. DBpedia: A Nucleus for a Web of Open Data. The
Semantic Web Lecture Notes in Computer Science 4825. p. 722.
Visto que contratos pblicos compem entre 10% e doi:10.1007/978-3-540-76298-0_52. ISBN 978-3-540-76297-3.
15% do PIB do pas (OCDE 2015), auditorias de compras e Cao, M., R. Chychyla, and T. Stewart. 2015. Big Data analytics in
a identificao de possveis anomalias ou fraudes so ques- financial statement audits. Accounting Horizons, 29(2), pp.423-429.
tes importantes. Esse artigo discutiu o uso e os benefcios
dos aplicativos para as auditorias de compras governamen- Dai, J., J. P. Krahel, and M. A. Vasarhelyi. 2014. Which Audit App(s)
tais. Vinte e nove aplicativos especficas foram propostos Should Auditors Use? An Exploratory Study of Using Recommender
para facilitar a auditoria dos gastos pblicos. Oito aplicati- Systems for Audit App Selection. Working Paper.
vos foram desenvolvidos para demonstrar a sua utilidade Dai, J., and Q. Li. 2016. Designing Audit Apps for Armchair Auditors to
em auditorias de contratos. Esse artigo pode fornecer ideias Analyze Government Procurement Contracts. Journal of Emerging
sobre como criar aplicativos eficazes e como usar aplicati- Technologies in Accounting. Forth coming.
vos em auditoria de contratos governamentais.
Data.gov. 2016. https://www.data.gov/open-gov/.
NOTAS Economist. 2015. Open government data: Out of the box. Available
at: http://www.economist.com/node/21678833/print.
1 Este trabalho baseado no artigo publicado no Journal of
Nigrini, M. J. 1999. I've Got Your Number: How a mathematical
Emerging Technologies in Accounting (Dai and Li 2016).
phenomenon can help CPAs uncover fraud and other irregularities.
Journal of Accountancy.
2 Por exemplo, Caseware tem mais de 50 aplicativos de auditoria
em um mercado on-line (Dai et al. 2014). Qliksense permite que Nigrini, M., and S. J. Miller. 2009. Data diagnostics using second
usurios desenvolvam aplicativos de auditoria, criando um painel order tests of Benfords Law. Auditing: A Journal of Practice and
de controle personalizado. Outras empresas, como Forestpin Theory 28 (2): 305-324.
TeamMate Analytics, tambm desenvolveram alguns produtos
OECD. 2015. Size of public procurement, in Government at a
derivados de aplicativos.
Glance 2015, OECD Publishing, Paris. Available at: http://dx.doi.
org/10.1787/gov_glance-2015-42-en.
3 Exemplos de ADAS incluem ACL e CaseWare IDEA.
O'Leary, D. E. 2015. Armchair Auditors: Crowdsourcing Analysis of
4 Exemplos de GDAS incluem R, Weka, SPSS e SAS. Government Expenditures. Journal of Emerging Technologies in
Accounting.
5 Esse aplicativo foi desenvolvido atravs de Qlik Sense Robbins Geller Rudman & Dowd LLP. 2016. Government
Procurement Fraud. http://www.whistleblower-lawfirm.com/types-
6 http://bibliotecadigital.fgv.br/dspace/bitstream/handle/10438/16274/ of-fraud-Government-Procurement-Fraud.html.
Panel%202%20-%20Gabriel%20Palma%202_0.pdf?sequence=1.
Vasarhelyi, M. A., A. Kogan, and B. M. Tuttle. 2015. Big data in
7 Esse aplicativo foi desenvolvido usando Caseware IDEA. accounting: An overview. Accounting Horizons, 29(2), pp.381-396.
Rodrigo Affonso de
Albuquerque Nbrega
engenheiro cartgrafo
e doutor em Engenharia
de Transportes, alm de
professor adjunto da
Universidade Federal
de Minas Gerais.
retranca imagem
Setembro/Dezembro 2016 72
Artigos
quanto fase de planejamento, e a falta de transparncia estruturada das variveis geogrficas, das opinies dos
acerca dos dados e mtodos empregados nas anlises atores envolvidos, mesmo que distintas ou divergentes,
causa problemas de natureza tcnica e oramentria e das ponderaes nos pesos das variveis nas regras de
nas obras, refletindo o aumento do custo e dos prazos. tomada de deciso, com o objetivo de reproduzir cen-
Para haver um retorno efetivo da atividade de pla- rios diagnsticos e prognsticos. Para subsidiar a anlise
nejamento em transportes, de maneira transparente tanto multicritrio, desenvolvem-se metodologias para aper-
na esfera pblica quanto privada, imprescindvel que feioar o fluxo de trabalho, e estas so implantadas na
haja um pensamento sistmico dos projetos. Assim, modelagem do SIG. Cita-se nesse contexto a AHP, tcnica
vital que os profissionais envolvidos tomem decises desenvolvida por Saaty (1995) para permitir que a subje-
em conjunto e considerem a interao das variveis pre- tividade advinda das decises humanas seja minimizada
sentes em todas as fases do processo. Esse raciocnio o com a aplicao de regras matemticas no processo de
princpio da anlise multicritrio, com o suporte da tc- atribuies de peso s variveis. De acordo com Sadasi-
nica Analytic Hierarchy Process (AHP) (Saaty, 1995). Este vuni et al. (2009), esta tcnica aplicada como um mto-
modelo tem sido explorado em Sistemas de Informaes do de comparao de variveis para anlise multicritrio
Geogrficas (SIG) que permitem a modelagem espacial e se utiliza da modelagem matemtica para determinar
das variveis em um processo de tomada de deciso. prioridades, algo importante no tocante organizao das
Segundo o DNIT (BRASIL, 2012), a proposta de disparidades de valores, opinies e interesses dos agentes
construo do rodoanel caracteriza o projeto em trs envolvidos no planejamento de corredores de transporte.
segmentos: sul, norte e leste. O objeto deste trabalho Se por um lado o mtodo AHP utiliza valores
investigar, a partir das ferramentas de anlise supracita- pareados como dados de entrada, por outro lado suas
das, corredores de viabilidade para o Anel Sul, trecho informaes de sada correspondem a um ranking nu-
cujo estudo de viabilidade encontra-se em desenvolvi- mrico que elenca, ordena e atribui pesos s prefern-
mento e sem quaisquer resultados prvios apresentados. cias. No SIG, seu emprego mais frequente tem sido na
Neste contexto, esse artigo apresenta os resultados da composio dos valores atribudos aos pixels de mapas
modelagem geogrfica de dados para definir corredores digitais em formato matricial (NOBREGA et al., 2009).
alternativos que representem simultaneamente reas de Embora avanos significativos na contextualiza-
maior viabilidade econmica, tcnica e ambiental para a o geogrfica dos processos de tomada de deciso em
implantao dessa infraestrutura viria. Foram utilizados, transportes tenham sido alcanados nas dcadas de 1990
alm do edital pblico e do termo de referncia (BRASIL, e 2000, a metodologia AHP, acoplada ao SIG, tornou-se
2012), dados geogrficos de domnio pblico dos quais alvo de interesse em projetos prticos de corredores de
foram extradas as variveis ambientais, mercadolgicas, viabilidade h apenas alguns anos. No Brasil, o uso com-
logsticas e socioeconmicas utilizadas no modelo. binado de SIG e AHP em projetos de planejamento de
corredores de transportes no est restrito Academia.
2. ANLISE MULTICRITRIO E MODELAGEM Trabalhos recentes aplicados ao planejamento de ferro-
DO SIG EM TRANSPORTES vias foram desenvolvidos no mbito federal junto a gesto-
res de transportes e fiscalizao (BERBERIAN et al., 2015).
A demanda por metodologias para modernizar Essas iniciativas revelam o interesse dos gestores e tcni-
o planejamento do transporte notria e o geoproces- cos em transporte pela modernizao do processo de pla-
samento tem sido pea-chave para integrar, de forma nejamento. Os resultados tm comprovado o potencial
coordenada, as inmeras variveis espaciais deste pro- do geoprocessamento em catalisar no s a enorme gama
cesso. A insero do SIG como suporte ao planejamento de variveis envolvidas no planejamento de transportes,
de corredores de transportes demanda grande volume mas tambm em promover meios de modelar solues
de dados. De acordo com Longley et al. (2013), um SIG perante a complexidade das polticas pblicas, ambientais
caracterizado por um conjunto de construtores para e de transportes envolvidas no processo.
representar objetos, ferramentas e processos em am-
biente computadorizado, normalmente operando na 3. REA DE ESTUDO
forma de modelos de dados geogrficos.
Um dos modelos que tem sido discutido e utili- A RMBH, composta por 34 municpios, um
zado juntamente com o SIG para apoio tomada de de- polo gerador de fluxos por concentrar altas demandas
ciso a anlise multicritrio. Esta propicia a integrao de transporte para suprir as atividades comerciais, in-
dustriais, minerrias e de servios. interceptada por no municpio de Nova Lima, foram eleitos pelo DNIT
importantes rodovias federais como a BR-040, BR-381, para origem e destino do Anel Sul. A Figura 1 ilustra a
BR-262 e BR-356, pelas quais trafegam tambm vecu- proposta, interligando os fluxos da BR-040 e da BR-381,
los de pequeno, mdio e grande porte em circulao respectivas sadas para Rio de Janeiro e So Paulo.
interna. Visando a mitigar os problemas de congestio-
namento e segurana relativos ao excesso de veculos 4. METODOLOGIA
que obrigatoriamente cruzam essas reas urbanas, foi
proposto um rodoanel de forma a oferecer uma alterna- Para o desenvolvimento deste trabalho foram neces-
tiva externa RMBH. De acordo com o DNIT (BRASIL, srias a coleta e a construo da base de dados, tanto tabu-
2012), o Anel Sul parte integrante do projeto de um lares quanto geoespaciais. No que tange documentao
complexo virio envolvendo o Rodoanel Norte (Trevo tcnica, foram utilizados como norteador para a modelagem
da Krupp-Ravena, com 67 km de extenso) e o Anel de corredores os Termos de referncia para o estudo do tra-
Leste (Olhos Dgua-Sabar com 22 km de extenso). ado e elaborao do projeto executivo de engenharia para
A regio proposta para a ala sul do rodoanel caracte- o contorno rodovirio sul da regio metropolitana de Belo
rizada por densidade populacional elevada, atividades Horizonte BR-040/MG (BRASIL, 2012). Este documento se
industriais, reas vulnerveis e de proteo ambiental. caracteriza como Anexo I Projeto bsico para contratao
De acordo com o edital e termo de referncia, os pontos de servio segundo a alnea I, 2, Art. 7, da Lei n 8.666 de
localizados no Contorno de Betim e no Jardim Canad, 21/06/93, cujo nmero de processo o 50600.032686/2011-
Figura1:
Localizao da rea de estudo
Setembro/Dezembro 2016 74
Artigos
78 (BRASIL, 2012). Estes termos orientam quanto deter- Na sequncia, devido necessidade de emprego
minao de variveis em seu prprio texto, assim como de dados em formato matricial para a anlise multicrite-
indicam demais manuais e documentos tcnicos para con- rial utilizada no modelo, os dados originais em formato
sulta, como as Instrues de Servio (IS) e Escopos Bsicos vetorial e tabular (Tabela 1) foram convertidos para o
(EB), alm de terem sido utilizados como diretrizes para a formato matricial. A transformao de dados vetoriais
modelagem geogrfica deste trabalho. (discretos) em dados matriciais (contnuos) possibilita
As bases geogrficas (Tabela 1) que compem des- a realizao da lgebra de mapas. A Figura 2 ilustra um
te estudo foram adquiridas mediante contatos telefnicas exemplo de transformao de dados de formato vetorial
e visitas. Para facilitar a organizao, os dados foram se- para matricial e sua respectiva integrao com outros da-
parados em subconjuntos, conforme a descrio dos ter- dos matriciais para a composio da superfcie de custo
mos de referncia do Anel Sul na RMBH, informando que acumulado por meio da lgebra de mapas.
o estudo de traado dever considerar simultaneamente
questes ambientais, culturais, sociais, comunitrias, 4.2 ANLISE MULTICRITERIAL, SUPERFCIES DE
geogrficas, de engenharia e financeiras envolvidas no ESFORO E CORREDORES DE VIABILIDADE
estudo do empreendimento (BRASIL, 2012). A arquite-
tura do modelo seguiu as orientaes de Nbrega (2014). Esta etapa consistiu na aplicao da tcnica AHP
para padronizao das variveis e construo da super-
4.1 TRATAMENTO E PROCESSAMENTO DOS DADOS fcie de custo acumulado. O emprego se respaldou em
trs nveis: intravariveis, intervariveis e intergrupos,
Um procedimento essencial que antecedeu o pro- sendo este ltimo o responsvel pela integrao da su-
cessamento dos dados geogrficos foi a padronizao do perfcie de custo final. O cerne desse processo consiste
sistema de coordenadas, posto que o simples emprego na atribuio de ndices de importncia a variveis do
da projeo cartogrfica correta pode evitar inconsistn- modelo que exigem conhecimento multidisciplinar.
cias nas medies de um projeto linear de engenharia. No nvel intravarivel, cada dado de entrada foi
Neste estudo, todos os dados foram reprojetados para o analisado para que fossem convertidos em planos de in-
sistema geodsico Sirgas 2000 com projeo UTM-23S. formao do modelo. A documentao tcnica do projeto
Tabela 1:
Organizao da base de dados
Figura2:
Ilustrao do tratamento e processamento de dados empregados no modelo
foi consultada para verificar como cada varivel poderia ser como entrada para o terceiro nvel do processo AHP
explorada e quais os graus de importncia de cada classe intergrupos.
presente no dado. Tomam-se como exemplo as distncias A Figura 3 (inferior) ilustra a integrao dos gru-
euclidianas dos cursos dgua na Figura 2: enquanto o dado pos em quatro diferentes configuraes de valores, por
vetorial informa apenas a presena ou no de rio, o dado sua vez obtidos por meio de perspectivas distintas que
matricial informa o quo distante ele est. Essas distncias visaram focar a viabilidade dos corredores na preserva-
foram categorizadas e ponderadas seguindo critrios que o de interesses prprios. Cada perspectiva adotada
indiretamente refletem na possvel presena de mata ciliar, foi intencionalmente focada em defender interesses am-
no alto custo para travessia ou mesmo em solos moles e bientais, reduo de custos de engenharia, atendimento
colapsveis. Procedeu-se com a converso de dados vetor- a demanda mercadolgica/logstica, ou em minimizar
-matriz e o respectivo emprego da tcnica AHP para cada impactos socioeconmicos negativos. Como resultante
varivel, conforme ilustra a Figura 3 (superior), gerando as- foram produzidos quatro cenrios distintos, cada qual
sim planos de informao que foram integrados por grupo conservador em seus interesses, para que com isso pu-
para o desenvolvimento do segundo nvel da anlise mul- dessem ser computadas as alternativas de corredores.
ticriterial, como proposto em Nbrega (2013). Uma vez computadas as superfcies integradas de
Para o nvel intervariveis, os planos de infor- esforo para cada cenrio, estas foram utilizadas como
mao foram organizados em 4 grupos: restries am- base para simular computacionalmente o esforo pre-
bientais, biofsico, mercadolgico e suporte logstico e visto para conectar os pontos de origem e destino, pon-
socioeconmico. As ponderaes entre os diferentes tos inicial e final do projeto, localizados na BR-040 e na
planos de informao por grupo foram resultantes de BR-381, respectivamente. Esse clculo feito em duas
consultas a especialistas. Foram adotadas comparaes etapas, na qual inicialmente so computados os custos
pareadas para evitar inconsistncias nos resultados, de afastamento (esforo vs. distncia) dos dois pontos
como descrito em Sadasivuni et al. (2009). Como resul- extremos, para ento integrar os dois mapas resultantes
tado foram geradas superfcies de esforo acumulado em uma superfcie final que revela o corredor de menos
que correspondem a mapas em formato matricial onde esforo, consequentemente o de maior viabilidade se-
cada clula representada pelo valor calculado de seu gundo a perspectiva do cenrio adotado (Figura 4).
respectivo esforo (ou custo de implantao) acumula-
do das variveis que participaram da composio em 5. RESULTADOS
cada grupo. A Figura 3 (centro) ilustra esse processo
para as variveis de um grupo Biofsico. O processo Todo o desenvolvimento metodolgico teve
foi reproduzido para os demais grupos, resultando em como objetivo a gerao de corredores de transporte,
quatro superfcies de esforo acumulado que serviram cujos resultados esto apresentados na Figura 5. Assim,
Setembro/Dezembro 2016 76
Artigos
Figura 3:
Regras de deciso intravariveis, intervariveis e intergrupos utilizadas no modelo
Figura 4:
Ilustrao do processo de clculo
de um corredor de viabilidade
foram produzidos quatro cenrios: restries ambien- Com relao extenso das alternativas, o cenrio
tais, biofsico, socioeconmico e mercadolgico e su- ambiental produziu um corredor com 24,8 km, o cenrio
porte logstico. Estes cenrios respeitaram a origem e biofsico um corredor com 25 km, o mercadolgico com
destino presentes nos termos de referncia. 25,2 km e o cenrio socioeconmico produziu duas alterna-
A partir do desenho dos corredores foi possvel tivas com 25,2 km e 23,7 km de extenso, respectivamente.
calcular mtricas comparativas como extenso do pro- Quanto anlise de declividade do terreno, os
jeto e interseo dos corredores para com outras bases resultados mostraram que, inevitavelmente, os traados
de dados, a fim de quantificar valores para avaliar o im- dos corredores devero interceptar reas de alta decli-
pacto e comparar as alternativas. Para demonstrar esta vidade, fato justificado pela natureza geomorfolgica
anlise de sensibilidade, foram escolhidas quatro vari- da regio. Entretanto, no modelo se considerou o alto
veis que geralmente so preponderantes em avaliao esforo para transpor essas reas e a construo dos
de alternativas de corredores virios: declividade, rea corredores evitou reas com rampas acentuadas. Uma
urbana, unidades de conservao e rea vegetada. Con- sntese da declividade mdia por corredor para os quar-
tudo, a metodologia pode ser aplicada para quantificar to cenrios avaliados mostrou que o cenrio biofsico
o nmero de residncias a serem afetadas, de rios a se- apresentou menor mdia (13,7%), seguido pelo cenrio
rem transpostos ou mesmo para monetizar o impacto mercadolgico/logstico (13,9%) e o de restries am-
de cada corredor alternativo, a depender da disponibi- bientais (14,1%). O cenrio socioeconmico apresentou
lidade de dados presentes na rea de estudo. a maior mdia (14,6%).
Figura 5:
Corredores computados por cada cenrio
Setembro/Dezembro 2016 78
Artigos
Grfico 1:
Mtricas de impacto para reas urbanas, vegetadas e pertencentes a unidades
de conservao interceptadas pelos corredores dos cenrios analisados
Para as variveis rea urbana, unidades de conser- entre o Rodoanel e a BR-040 que podem produzir meno-
vao e vegetao, as reas afetadas podem ser visualiza- res impactos ambientais e possivelmente menores custos
das no Grfico 1. Em relao ao cenrio biofsico, para o de engenharia por interceptarem reas mais planas.
qual a ponderao das variveis vegetao e unidades de
conservao foi maior, observou-se que quando se pro- 6. CONCLUSO
porcionou liberdade ao modelo para construir o corredor,
os resultados se mostraram melhores, correspondendo a Na realizao desse trabalho, deparamos com
menores reas impactadas. No subconjunto socioecon- diversos desafios a respeito da interpretao dos ter-
mico, o qual evidencia a preferncia pelo distanciamento mos de referncia e da documentao tcnica e pro-
das reas urbanas, observou-se que o resultado alcanou cessamento de dados. Todavia o objetivo principal
o menor impacto dentre todos os cenrios avaliados. de obter traados alternativos para o Rodoanel Sul da
Contudo, as anlises revelam que existem di- regio metropolitana de Belo Horizonte a partir de
versas possibilidades de uso quando se identifica o que perspectivas distintas, realsticas e confrontantes foi
sofrer interveno e quanto. O modelo permite aper- atingindo. Foram gerados corredores considerando
feioar as anlises de risco e otimizar o preenchimento diferentes variveis, baseados no emprego de geotec-
da matriz de impacto ambiental utilizada para avaliar nologias e anlise multicriterial. Os resultados per-
as alternativas do projeto. mitiram uma interao harmnica entre a aplicao
Outras duas propostas foram desenvolvidas con- desta tcnica e a modelagem de dados geogrficos. A
siderando os cenrios biofsico e socioeconmico, tendo capacidade operacional do modelo em processar re-
como origem o ponto institudo pelo DNIT na BR-381 e as extensas com profundo detalhamento contextual
como destino a BR-040, sem a definio de uma locali- das anlises, bem como a otimizao do tempo e da
dade especfica (Figura 7). A idia foi verificar se o local capacidade analtica dos atores envolvidos no modelo
na BR-040 apresentado no edital corresponde ao local de contribuem de forma positiva para a modernizao do
maior viabilidade segundo os critrios adotados nesta in- processo de planejamento de transportes.
vestigao. Embora no quantificadas, as anlises preli- O trabalho piloto de anlise multicritrio espacial
minares indicam que o ponto de origem apresentado no mostrou grande potencial de aplicao em controle externo.
edital do projeto justificado quando considerado a ne- Acredita-se que, de posse do modelo e de seu conhecimen-
cessidade de distanciar o rodoanel de reas urbanas exis- to operacional, as aes de fiscalizao e controle externo
tentes, todavia o modelo apontou alternativas de conexo podero ser desenvolvidas com maior agilidade e acurcia.
Figura 7:
Processamento alternativo para testar a aderncia dos pontos
de origem e destino publicados no edital do projeto
Os corredores resultantes desse trabalho ainda no po- LONGLEY, P. A. et al. Sistemas e cincia da informao
dem ser comparados ao traado oficial do Rodoanel da RMBH, geogrfica. 3. ed. Porto Alegre: Bookman, 2013.
posto que este no apresenta a fase de estudo de viabilidade
concluda. Espera-se que mtricas comparativas possam ser NOBREGA, R. A. A. Ferrovia Norte-Sul: estudo dos traados
quantificadas e analisadas a partir do trmino do projeto por alternativos para escoamento eficiente da produo. In: ENCONTRO
parte do DNIT ou de sua apresentao para a comunidade. REGIONAL DA 3 CMARA DE COORDENAO E REVISO DO
MINISTRIO PBLICO FEDERAL REGIES SUL/SUDESTE, 2., 2013,
7. AGRADECIMENTOS Florianpolis. Anais Florianpolis, 17 out. 2013.
Os autores agradecem ao CNPq pelo auxlio no ______. Relatrio de fechamento de projeto de extenso: ligao
desenvolvimento da pesquisa. Pato Branco/PR Cruz Alta/RS. Belo Horizonte: UFMG, 2014.
Setembro/Dezembro 2016 80
Artigos
O potencial de dados de
sensoriamento remoto na
fiscalizao de obras pblicas
retranca imagem
Setembro/Dezembro 2016 82
Artigos
das obras pblicas em execuo ou concesso em todo o em relao ao que foi executado em cada obra, tanto na
territrio nacional (MIRANDA; MATOS, 2015; VITAL dimenso espacial como temporal. Essa abordagem per-
et al., 2015). No processo de fiscalizao fundamental mite que se compare o cronograma pr-estabelecido da
obter informaes precisas sobre a evoluo das obras obra com o andamento real, permitindo reconstruir de
pblicas (construo, reforma, fabricao, recupera- forma total ou parcial o histrico financeiro e executivo.
o ou ampliao de bem pblico), buscando detectar Contudo, o emprego de imagens para a fiscali-
eventuais inconsistncias ou inexistncia dos elementos zao de obras pblicas apresentam dificuldades simi-
presentes no projeto bsico e nas especificaes tcni- lares aos descritos no mapeamento de feies de reas
cas. Nessa conjuntura, o sensoriamento remoto pode urbanas, tais como (CAVALLI et al., 2008; WENTZ et
ser uma importante ferramenta, proporcionando um al., 2014): (a) os espectros dos pixels de ambientes ur-
monitoramento peridico de extensas reas com baixo banos so constitudos por misturas espectrais devido
custo. Nos ltimos anos, extensos esforos de pesquisa alta heterogeneidade desses ambientes, podendo gerar
tm sido feitos para a deteco de mudanas utilizando confuses entre as classes no processo de classificao,
imagens de sensoriamento remoto em diferentes cen- e (b) as estruturas fsicas das classes urbanas variam es-
rios: (a) urbanos (HEGAZY; KALOOP, 2015; SUN et al., pacialmente, considerando diferentes composies de
2013); (b) agrcolas (MENKE et al., 2009; OLIVEIRA et telhados, pavimentos e formas arquitetnicas. Assim,
al., 2014); e (c) reas naturais e de preservao ambien- as obras de infraestrutura (edificaes, pontes, estradas,
tal (COPPIN; BAUER, 1996; YADAV; KAPOOR; SAR- hidrovias, ferrovias, entre outros) so constitudas por
MA, 2012). Portanto, o sensoriamento remoto tem sido diferentes materiais (asfalto, pinturas, concreto, metal,
amplamente utilizado para avaliar a dinmica espacial vidro, telhas, vegetao e solo) que esto combinados
da superfcie terrestre e a eficcia do planejamento ter- em diferentes propores (JENSEN; COWEN, 1999). Por
ritorial. Especificamente, estudos sobre a fiscalizao exemplo, duas pontes podem ter comportamentos dife-
de obras pblicas usando sensoriamento remoto so renciados tanto pelo tipo de materiais utilizados como
pouco relatados nos peridicos cientficos. A ausncia pelas suas diferenas arquitetnicas. Alm disso, outro
de pesquisa para aplicao dessa tcnica demonstra um fator de complexidade que durante a evoluo de uma
extenso campo para inovaes cientficas, contendo re- obra ocorre uma intensa modificao dos elementos e
levncia econmica e retorno imediato para a sociedade. padres de construo. Portanto, o acompanhamento de
O acervo de imagens multitemporais possibilita forne- uma obra por sensoriamento remoto exige a obteno de
cer subsdios para a comparao do que foi planejado informaes constantes e detalhadas, alm da elaborao
Setembro/Dezembro 2016 84
Artigos
Tabela 1:
Descrio dos principais satlites orbitais. As imagens disponveis gratuitamente so demarcadas com um asterisco (*)
SATLITES DISPONVEIS RESOLUO ESPACIAL RESOLUO TEMPORAL RESOLUO ESPECTRAL
2,5 m Varivel 1 banda pancromtica
ALOS 10 m Varivel 3 bandas no visvel
10 a 100 m Varivel 1 banda no infravermelho
CARTOSAT 2,5 m 5 dias 1 banda pancromtica
5m Varivel 1 banda (pancromtica)
2 bandas no visvel
10 m Varivel
1 banda no infravermelho
3 bandas no visvel
20 m 26 dias
1 banda no infravermelho
CBERS*
1 banda pancromtica
40 m 26 dias
2 bandas no infravermelho
80 m 26 dias 1 banda no termal
3 bandas no visvel
64 m 5 dias
1 banda no infravermelho
EROS 0,7 m Programado 1 banda (pancromtica)
2m Programado 1 banda (pancromtica)
FORMOSAT 3 bandas no visvel
8m Programado
1 banda no infravermelho
0,8 m 5 dias 1 banda (pancromtica)
GAOFEN 3 bandas no visvel
3,2 m 5 dias
1 banda no infravermelho
0,5 m Programado 1 banda (pancromtica)
GEOEYE 3 bandas no visvel
2m Programado
1 banda no infravermelho
1m Varivel 1 banda pancromtica
IKONOS 3 bandas no visvel
4m Varivel
1 banda no infravermelho
1m Programado 1 banda pancromtica
KAZEOSAT-1 3 bandas no visvel
4m Programado
1 banda no infravermelho
1m Programado 1 banda pancromtica
KOMPSAT 2 3 bandas no visvel
4m Programado
1 banda no infravermelho
0,7 m Diria (possvel) 1 banda pancromtica
KOMPSAT 3 3 bandas no visvel
2,8 m Diria (possvel)
1 banda no infravermelho
0,55 m Diria (possvel) 1 banda pancromtica
KOMPSAT 3A 2,2 m Diria (possvel) 3 bandas no visvel
5,5 m Diria (possvel) 2 bandas no infravermelho
3 bandas no visvel
30 m 16 dias
LANDSAT 5* 3 bandas no infravermelho
120 m 16 dias 1 banda no termal
15 m 16 dias 1 banda pancromtica
3 bandas no visvel
LANDSAT 7* 30 m 16 dias
3 bandas no infravermelho
60 m 16 dias 1 banda no termal
15 m 16 dias 1 banda pancromtica
4 bandas no visvel
3 bandas no infravermelho
LANDSAT 8 30 m 16 dias
1 banda aerossol
1 banda cirrus
100 m 16 dias 2 bandas no termal
Setembro/Dezembro 2016 86
Artigos
classe (sombras, ngulo do sol, as lacunas na copa das r- para diferentes alvos a partir de espectrmetros de cam-
vores etc.) pode dificultar a classificao baseada em pixel po ou laboratrio para servir de suporte classificao,
e favorecer tcnicas baseadas em objetos que so represen- tais como elementos urbanos (BEN-DOR; LEVIN; SA-
tados por valores mdios do segmento (YU et al., 2006). ARONI, 2001; HEROLD et al., 2004), minerais (CLARK
Um problema da classificao baseada em obje- et al., 2007), plantaes (RAO; GARG; GHOSH, 2007) e
tos a dependncia da etapa de segmentao, que pode reas alagadas (ZOMER; TRABUCCO; USTIN, 2009).
gerar segmentos em excesso ou em quantidade reduzi- O advento das imagens hiperspectrais (Figura 1),
da em relao s feies do terreno (LIU; XIA, 2010). caracterizadas por conter centenas de bandas espectrais
Normalmente, a falta de segmentos considerada pior estreitas e contnuas no espectro solar refletido, permitiu
do que o excesso (KIM; MADDEN; WARNER, 2009). A o desenvolvimento de novas tcnicas que aprimoraram
minimizao desse tipo de erro pode ser obtida atravs a deteco e quantificao dos materiais (CARVALHO
de sucessivos testes de segmentaes antes da classifica- JNIOR et al., 2003). A classificao espectral busca
o (TRIAS-SANZ; STAMON; LOUCHET, 2008) e por converter os sinais espectrais que refletem as coberturas
anlise de acurcia dos segmentos (DORREN; MAIER; urbanas em categorias que representam a natureza fsica
SEIJMONSBERGEN, 2003; KIM; MADDEN; XU, 2010). da superfcie. Alm disso, essas imagens permitem uma
anlise espectral subpixel com a estimativa de abundn-
2.2 RESOLUO ESPECTRAL cia dos materiais superficiais contidos no pixel a partir
da anlise linear de mistura (PHINN et al., 2002; WU;
O conhecimento pormenorizado das caracte- MURRAY, 2003) e sua variao Multiple Endmember
rsticas espectrais permite uma acurada identificao Spectral Mixture Models (MESMA) (DEMARCHI et al.,
dos elementos superficiais. Nesse propsito, diversos 2012; FRANKE et al., 2009). Essa abordagem possibilita
estudos desenvolvem bibliotecas espectrais especficas tratar o problema de heterogeneidade espectral dentro
Figura 1:
Concepo do sensor hiperescpectral AVIRIS, segundo a qual a alta resoluo espectral torna a informao de um dado pixel
prxima obtida por meio de medies realizadas em laboratrio e/ou campo. (Modificado de GREEN et al., 1998).
de uma mesma classe, que uma das principais dificul- (ABADE et al., 2015), fitofisionomias (CARVALHO J-
dades em reas urbanas (HEIDEN; SEGL; KAUFMANN, NIOR; HERMUCHE; GUIMARES, 2006; CARVALHO
2007). Um mesmo tipo de classe pode ser caracterizado JNIOR et al., 2008) e plantios (COUTO JNIOR; CAR-
por diversos materiais distintos espectralmente ou ter VALHO JNIOR; MARTINS, 2012; SAKAMOTO et al.,
composies diferenciadas devido deteriorao ao 2005). Essa abordagem permite detectar eventos naturais
longo do tempo (DEMARCHI et al., 2012). Por exem- singulares, tais como fogo (CARVALHO JNIOR et al.
plo, os telhados podem ser constitudos por diferentes 2015) e inundaes (AIRES et al., 2014).
materiais e, alm disso, modificar o seu comportamento Na fiscalizao de obras de engenharia, funda-
espectral devido ao acmulo de fungos e sujeira. mental avaliar a resoluo temporal dos sensores remotos.
Normalmente, as imagens hiperespectrais mais utili- A obra progride atravs de um calendrio programado que
zadas nos estudos urbanos so do sensor Hyperion a bordo permite estabelecer quais sensores possuem adequadas re-
do satlite EO-1 e os provenientes de sensores embarcados solues temporais para a sua fiscalizao. As condies
em aeronaves, como o Airborne Visible Infrared Imaging climticas (interferncia atmosfrica e cobertura de nuvem)
Spectrometer (AVIRIS), Compact Airborne Spectrographic tambm afetam a aquisio de imagens, podendo ser cr-
Imager (CASI) e o Hyperspectral Mapper (HyMap). ticas para sensores pticos em algumas localidades, como
na regio amaznica. Nesse caso, deve-se buscar satlites
2.3 RESOLUO TEMPORAL de alta frequncia de revisita para a seleo de imagens ou
adotar sensores de imagem radar.
O advento de sensores orbitais com alta resoluo Os sensores de alta resoluo temporal possuem
temporal tem promovido uma nova abordagem na clas- normalmente baixa resoluo espacial, como o caso
sificao de alvos superficiais, que consideram aspectos do sensor MODIS e o Advanced Very High Resolution
de mudanas cclicas ou com trajetrias conhecidas de Radiometer (AVHRR). No entanto, muitas misses
um evento ou de um objeto que podem ser descritas e utilizam uma constelao de satlites idnticos que
identificadas por uma assinatura temporal. A similaridade orbitam a Terra de forma sincronizada, permitindo
espectral entre os diferentes tipos de vegetao, caracte- uma sucesso de imagens com alto grau de revisita e
rizadas por serem constitudas pelas mesmas feies de alta resoluo espacial, como o caso dos seguintes
absoro, pode apresentar dificuldades para serem dis- programas orbitais: Rapideye (5 satlites); Triplesat (3
tinguidas a partir de uma nica imagem no tempo. No satlites); Pleiades (2 satlites) e o Spot 6-7 (2 satlites).
entanto, sries temporais de sensoriamento remoto per- Apesar de sries temporais constitudas com imagens
mitem estabelecer uma assinatura fenolgica caractersti- com mesmas especificaes facilitar o desenvolvimen-
ca, identificando diferentes tipos de ecossistemas naturais to de mtodos automatizados, estudos conciliando
Setembro/Dezembro 2016 88
Artigos
imagens de diferentes sensores tornam-se um desafio retorno das diferenas de fase das ondas para o satlite.
de pesquisa. Dentre os MDEs provenientes desse mtodo, destacam-
-se o Radarsat 1 e 2, Sentinel 1 e SRTM, sendo este l-
2.4 MODELOS DIGITAIS DE ELEVAO timo o mais utilizado mundialmente (JARIHANI et al.,
2015; MUSA; POPESCU; MYNETT, 2015). Esses pro-
Os modelos digitais de elevao (MDE) so repre- dutos tm a vantagem de mapear de forma contnua,
sentaes em 3D da superfcie terrestre que reproduzem mesmo com a cobertura de nuvens. A Figura 2 mostra
as feies naturais e antrpicas da paisagem. A constru- um exemplo de MDE de uma rea urbana (A) e uma
o desses modelos inicia-se a partir de fotografias areas fotografia area sobreposta a este MDE (B).
analgicas e passa a ser desenvolvida por outras tecno- A produo de MDEs a partir de radar laser, que
logias, tais como: fotografia area digital, sensor tico mede a distncia entre um sensor e um alvo baseado na
orbital de alta resoluo, radar interferomtrico e radar metade do tempo gasto entre a emisso e deteco do
laser aerotransportado. Atualmente, veculos areos no pulso (BALTSAVIAS, 1999), j possui algumas dcadas.
tripulados (VANT) carregam a bordo esses diferentes sen- Porm, grandes avanos tecnolgicos nos ltimos anos
sores que elaboram MDEs. Recentemente, os sensores possibilitaram identificar tnues mudanas de eleva-
de radar laser mvel podem ser acoplados em qualquer o a partir de densa nuvem de pontos, possibilitando
plataforma (um barco, um automvel etc.). mapear e distinguir objetos com pequenas variaes
Os sensores ticos a bordo de satlites mapeiam a de textura (MENG; CURRIT; ZHAO, 2010). Os sen-
superfcie terrestre em dois pontos de vista distintos, pos- sores laser podem ser acoplados em aeronaves, sat-
sibilitando a extrao de MDEs. Dentre eles destacam-se lites e veculos areos no tripulados. Recentemente
satlites com diferentes resolues espaciais, desenvol- foi desenvolvido o sistema mvel de varredura a laser
vidos por agncias espaciais, tais como a srie Spot, IRS, que adquire dados em 2D e 3D e que so implanta-
Cartosat-1, Alos-Prism, WorldView-2, QuickBird-2, Iko- dos em qualquer plataforma mvel terrestre ou nu-
nos-2, Aster, entre muitos outros. A aquisio dos dados tica (PUENTE et al., 2013). Essa tecnologia apresenta
pode ser ao longo de uma nica linha de varredura (Spot) grandes vantagens, tais como: (a) diminuio de custo
ou adquirido paralelamente com uma rea de superposio devido captura de dados em alta velocidade; (b) alta
(QuickBird) (POLI; TOUTIN, 2012). As imagens orbitais densidade de pontos, garantindo um levantamento
vm preenchendo a lacuna na produo de MDEs precisos, planialtimtrico completo que diminui o nmero de
porm cmeras areas de ltima gerao a bordo de avies, dados questionveis; e (c) visualizao 3D que permi-
como a ADS 80, produzem atualmente preciso compa- te verificar se os objetos mapeados correspondem s
tvel com imagens de sensores remotos de alta resoluo, condies do mundo real.
como o Worldview (HOBI; GINZLER, 2012). Os MDEs so amplamente utilizados na deteco
Os MDEs elaborados por Interferometric Syn- e descrio de feies urbanas (KIM; NEVATIA, 2004).
thetic Aperture Radar (InSAR) so obtidos a partir do No entanto, as obstrues no ambiente urbano denso ain-
Figura 2:
MDE de rea urbana (A) e Fotografia area sobreposta ao MDE (B).
A B
3. PROCESSAMENTO DIGITAL DE
IMAGENS E DETECO DE MUDANA
Setembro/Dezembro 2016 90
Artigos
imagens, destacando: regresso linear robusta (HEO; 2005): (a) pr-classificao, na qual inicialmente gerada
FITZHUGH, 2000) densidade no diagrama de frequn- uma nova imagem realando as feies de mudana e
cia (SONG et al., 2001; CHEN; VIERLING; DEERING, depois realiza-se a etapa de classificao; e (b) ps-classi-
2005); medidas espectrais de distncia e similaridades ficao, na qual inicialmente realiza-se uma classificao
(CARVALHO JNIOR et al., 2013), medidas espectrais independente para cada tempo e em seguida efetua-se a
entre componentes cannicas (CANTY; NIELSEN; SCH- extrao e quantificao das reas de mudana a partir
MIDT, 2004); e zonas de no mudana envolta da linha da tabulao cruzada entre as imagens temporais.
de regresso (ELVIDGE et al., 1995) ou de componentes Diferentes mtodos de pr-classificao fo-
principais (DU et al., 2002). Com o propsito de aglu- ram propostos: (a) operaes algbricas de subtrao
tinar todas essas tcnicas, Carvalho Jnior et al. (2013) e diviso de imagens multitemporais (COPPIN et al.,
propuseram um mtodo sequencial para a determina- 2001; FRANKLIN et al., 2003; SKAKUN; WULDER;
o dos pontos invariantes composto pelos seguintes FRANKLIN, 2003); (b) anlise de vetor de mudana
mtodos: (a) medidas espectrais nas imagens temporais (CARVALHO JNIOR et al., 2011; JOHNSON; KA-
originais ou nas componentes cannicas; (b) densida- SISCHKE, 1998); (c) mistura espectral (ADAMS et al.,
de do diagrama de disperso; e (c) regresso robusta. 1995); e (d) diversas transformaes lineares, como a
O presente mtodo est presente no programa Ablio. anlise de componentes principais (BYRNE et al., 1980;
FUNG e LEDREW, 1987), anlise de correspondncia
3.2 DETECO DE MUDANA (CAKIR et al., 2006), anlise cannica (NIELSEN; CON-
RADSEN; SIMPSON, 1998) e Tasseled-Cap (HEALEY
Diferentes mtodos foram propostos para a de- et al., 2005). Os mtodos de pr-classificao, apesar
teco de mudana a partir de imagens de sensoriamen- de serem efetivos na localizao das mudanas, muitas
to remoto, havendo importantes revises bibliogrficas vezes so difceis de precisar a natureza da mudana,
sobre o tema (COPPIN et al., 2001; HALL; HAY, 2003; necessitando de outra etapa de classificao.
LAMBIN, 1999; LU et al., 2003; SINGH, 1989; TEWKES- Dessa forma, o mtodo de ps-classificao o
BURY et al., 2015). mais amplamente usado nos estudos de deteco de mu-
Os algoritmos de deteco de mudana so cons- dana em ambientes urbanos, por ser efetivo na descri-
titudos de duas etapas de processamento: (a) classifica- o da magnitude, localizao e natureza das alteraes
o; e (b) deteco de mudana. Uma classificao dos ocorridas (HARDIN; JACKSON; OTTERSTROM, 2007).
mtodos de deteco de mudana considera se a eta- As principais vantagens do mtodo de ps-classificao
pa de deteco de mudana precede ou aps a etapa so: (a) a independncia no processo de classificao das
de classificao, sendo denominados de (YUAN et al., imagens temporais compensa as variaes das condi-
es atmosfricas, mudanas fenolgicas e umidade de a fim de reforar a relao entre o projeto original da
solo; (b) o processo de atualizao dos dados simples, obra e a magnitude de mudana detectada na imagem.
beneficiando o monitoramento; (c) possibilita comparar O avano de modelos especialistas para a deteco de
dados de sensores com diferentes tipos de resolues; e mudana de forma automatizada ou semiautomatiza-
(d) permite individualizar as diferentes categorias de mu- da das obras pblicas permitir estabelecer um sistema
dana, no ficando restrito em apenas realar as feies de alerta com priorizao de vistorias em campo. Nes-
de mudanas (COPPIN et al., 2001; MENKE et al., 2009). se propsito, deve-se ter um esforo de pesquisa com-
Em contraposio, as duas principais desvantagens desse putacional para o desenvolvimento de um conjunto de
mtodo so: (a) normalmente no completamente au- tcnicas de deteco de padres que permita aperfeioar
tomtico, o que torna o mtodo moroso; e (b) a preciso o gerenciamento das fases da obra reduzindo as incer-
da deteco das mudanas depende da acurcia da classi- tezas. Esse arsenal tecnolgico adequado aos diferentes
ficao em cada tempo, o que pode facilitar a propagao alvos permitir estabelecer estratgias para coibir a ao
de erros (YUAN et al., 2005; MENKE et al., 2009). de possveis fraudes ou atrasos no cronograma.
Conforme Silva et al. (2012), a classificao dire- O fator-chave para obter um mapeamento bem-
ta sobre as diversas bandas espectro-temporais no se -sucedido das obras de engenharia utilizar as imagens
enquadra nos mtodos de ps-classificao e pr-clas- de alta resoluo (espectral, espacial e temporal) e o
sificao, uma vez que as etapas de classificao e de MDE de forma integrada com a resposta pretendida des-
deteco de mudana so efetuadas sincronicamente.. crita pelo projeto executivo, constando todos os fatores
Nesse tipo de classificao so usados normalmente a especficos atividade de execuo. Diferentemente de
anlise de grupos (WEISMILLER et al., 1977) e as redes outros estudos de sensoriamento remoto em reas ur-
neurais artificiais (DAI; KORRAM, 1999). banas, no presente caso tem-se previamente a locao
espacial e as mudanas pretendidas, o que permite uma
4. CONCLUSO nova abordagem para o desenvolvimento de tcnicas
automatizadas considerando um modelo prvio.
No presente trabalho foram revistas as principais
potencialidades e desafios para o emprego do sensoria- REFERNCIAS
mento remoto na fiscalizao de obras dentro das ativida-
des do TCU, focando os seguintes aspectos: (a) qualidade ABADE, N. A. et al. Comparative Analysis of MODIS Time-Series
dos atributos da imagem; (b) etapas de processamento Classification Using Support Vector Machines and Methods
digital de imagens; e (c) possveis adequaes e esforos Based upon Distance and Similarity Measures in the Brazilian
necessrios para quantificar e entender as etapas das Cerrado-Caatinga Boundary. Remote Sensing, [S.l.], v. 7, n. 9, p.
obras pblicas. A fiscalizao de obras pblicas a partir 12160-12191, 2015.
de sensoriamento remoto um processo complexo, com
algum grau de interferncias entre classes e uma forte
componente de mudanas espaotemporais. Apenas uma
representao contnua no tempo dos elementos da obra
permite uma anlise e fiscalizao precisas. Para esse pro-
psito, medies repetitivas dos componentes espectrais
e espaciais da superfcie da Terra devem ser obtidas pre-
ferencialmente em alta resoluo. Cada atributo fornece
um tipo especfico de informaes sobre a obra, devendo
ser combinados para obter uma descrio detalhada dos
processos superficiais. Diferentes modelos de deteco
de mudanas devem ser testados, considerando as con-
dies de circunvizinhana e de ambientes.
A fiscalizao e o monitoramento a partir de tc-
nicas de geoprocessamento e sensoriamento remoto
permitem monitorar diferentes obras simultaneamente,
praticamente em tempo real. Essa nova abordagem ne-
cessita de um conjunto de investigaes metodolgicas,
Setembro/Dezembro 2016 92
Artigos
ADAMS, J. B. et al. Classification of Multispectral Images Based on CARVALHO JNIOR, A. O. et al. A New Approach to Change Vector
Fractions of Endmembers: Application to Land-Cover Change Analysis Using Distance and Similarity Measures. Remote Sensing,
in the Brazilian Amazon. Remote Sensing of Environment, [S.l.], [S.l.], v. 3, p. 2473-2493, 2011.
v. 52, p. 137-154, 1995.
______. Anlise de imagens hiperespectrais pelo mtodo
AIRES, F. et al. Characterization and Space-Time Downscaling of Multiple Endmember Spectral Mixture Analysis (MESMA) em
the Inundation Extent over the Inner Niger Delta Using GIEMS and depsito supergnico de nquel. Brazilian Journal of Geology, So
MODIS Data. Journal of Hydrometeorology, Washington, DC, v. Paulo, v. 33, n. 1, p. 63-74, 2003.
15, n. 1, p. 171-192, 2014.
______. Classificao de padres de savana usando assinaturas
ALMUTAIRI, A.; WARNER, T. A. Change Detection Accuracy and temporais NDVI do sensor MODIS no Parque Nacional Chapada dos
Image Properties: A Study Using Simulated Data. Remote Sensing, Veadeiros. Revista Brasileira de Geofsica, [S.l.], v. 26, n. 4, p. 505-517, 2008.
[S.l.], v. 2, p. 1508-1529, 2010.
______. Standardized Time-Series And Interannual Phenological
BALTSAVIAS, E. P. Airborne Laser Scanning: Basic Relations and Deviation: New Techniques for Burned-Area Detection Using
Formulas. ISPRS Journal of Photogrammetry and Remote Sensing, Long-Term MODIS-NBR Dataset. Remote Sensing, [S.l.], v. 7, n. 6,
[S.l.], v. 54, p. 199-214, 1999. p. 6950-6985, 2015.
BAUGH, C. A. et al. SRTM Vegetation Removal and Hydrodynamic ______. Radiometric Normalization of Temporal Images
Modeling Accuracy. Water Resource Research, Washington, DC, Combining Automatic Detection of Pseudo-Invariant Features
v. 49, p. 5276-5289, 2013. from the Distance and Similarity Spectral Measures, Density
Scatterplot Analysis, and Robust Regression. Remote Sensing,
BEN-DOR, E.; LEVIN, N.; SAARONI, H. A Spectral Based Recognition [S.l.], v. 5, n. 6, p. 2763-2794, 2013.
of the Urban Environment Using the Visible and Near-Infrared
Spectral Region (0.4-1.1 m): A Case Study Over Tel-Aviv. CAVALLI, R. M. et al. Hyperspectral Sensor Data Capability for
International Journal of Remote Sensing, Londres, v. 22, n. 11, p. Retrieving Complex Urban Land Cover in Comparison with
2193-2218, 2001. Multispectral Data: Venice City Case Study (Italy). Sensors, [S.l.], v.
8, n. 5, p. 3299-3320, 2008.
BLASCHKE, T. Object Based Image Analysis for Remote Sensing.
ISPRS Journal of Photogrammetry and Remote Sensing, [S.l.], v. CHEN, X.; VIERLING, L.; DEERING, D. A Simple and Effective
65, n. 1, p. 2-16, 2010. Radiometric Correction Method to Improve Landscape Change
Detection across Sensors and across Time. Remote Sensing of
BRASIL. Tribunal de Contas da Unio. Fiscobras 2015. 2015. Environment, [S.l.], v. 98, p. 63-79, 2005.
Disponvel em: <http://portal.tcu.gov.br/lumis/portal/file/
fileDownload.jsp?fileId=8A8182A250C885960150CD7694B146 CLARK, R. N. et al. USGS Digital Spectral Library Splib06a. US
CC&inline=1>. Acesso em: 20 out. 2016. Geological Survey, Digital Data Series, [S.l.], n. 231, 2007.
BYRNE, G. F.; CRAPPER, P. F.; MAYO, K. K. Monitoring Land Cover COPPIN, P. et al. Operational Monitoring of Green Biomass Change
Change by Principal Component Analysis of Multitemporal Landsat for Forest Management. Photogrammetric Engineering and
Data. Remote Sensing of Environment, [S.l.], v. 10, p. 175-184, 1980. Remote Sensing, Bethesda, v. 67, p. 603-611, 2001.
CAKIR, H. I.; KHORRAM, S.; NELSON, S. A. C. Correspondence COPPIN, P. R.; BAUER, M. E. Digital Change Detection in Forest
Analysis for Detecting Land Cover Change. Remote Sensing of Ecosystems with Remote Sensing Imagery. Remote Sensing
Environment, [S.l.], v. 102, n. 3-4, p. 306-317, 2006. Reviews, Londres, v. 13, n. 3-4, p. 207-234, 1996.
CANTY, M. J.; NIELSEN, A. A.; SCHMIDT, M. Automatic Radiometric COUTO JNIOR, A. F.; CARVALHO JNIOR, O. A.; MARTINS, E. S.
Normalization of Multitemporal Satellite Imagery. Remote Sries temporais MODIS aplicadas em sucesso de culturas de
Sensing of Environment, [S.l.], v. 91, p. 441-451, 2004. soja (Glycine max (L.) Merrill) e milho (Zeamays L.) em sistema de
plantio direto. Revista Brasileira de Cartografia, Rio de Janeiro, v.
64, n. 3, p. 405-418, 2012.
COWEN, D. J. et al.The Design and Implementation of an Integrated FRANKLIN, S. E. et al. Mountain Pine Beetle Red-Attack Forest
Gis For Environmental Applications. Photogrammetric Engineering Damage Classification Using Stratified Landsat TM Data in British
and Remote Sensing, Bethesda, v. 61, p. 1393-1404, 1995. Columbia, Canada. Photogrammetric Engineering and Remote
Sensing, Bethesda, v. 69, n. 3 p. 283-288, 2003.
DAI, X. L.; KHORRAM, S. Remotely Sensed Change Detection Based
on Artificial Neural Networks. Photogrammetric Engineering and FUNG, T.; LE DREW, E. Application of Principal Components
Remote Sensing, Bethesda, v. 65, n. 10, p. 1187-1194, 1999. Analysis to Change Detection. Photogrammetric Engineering
and Remote Sensing, Bethesda, v. 53, n. 12, p. 1649-1658, 1987.
______. The Effects of Image Misregistration on the Accuracy
of Remotely Sensed Change Detection. IEEE Transactions on GREEN, R. O. et al. Imaging Spectroscopy and the Airborne Visible/
Geoscience and Remote Sensing, [S.l.], v. 36, p. 1566-1577, 1998. Infrared Imaging Spectrometer (AVIRIS). Remote Sensing of
Environment, [S.l.], v. 65, p. 227-248, 1998.
CARVALHO JNIOR, O. A., HERMUCHE, P. M., GUIMARES, R. F.
Identificao regional da floresta estacional decidual na bacia do HALL, O.; HAY, G. J. A Multiscale Object-Specific Approach to
Rio Paran a partir da anlise multitemporal de imagens MODIS. Digital Change Detection. International Journal of Applied Earth
Revista Brasileira de Geofsica, [S.l.], v. 24, n. 3, p. 319-332, 2006. Observation and Geoinformation, [S.l.], v. 4, p. 311-327, 2003.
DEMARCHI, L. et al. Multiple Endmember Unmixing of CHRIS/ HARDIN, P. J.; JACKSON, M. W.; OTTERSTROM, S. M. Mapping,
Proba Imagery for Mapping impervious Surfaces in Urban and Measuring, and Modeling Urban Growth. In: JENSEN, R. R.;
Suburban Environments. IEEE Transactions on Geoscience and GATRELL J. D.; MCLEAN D. (Org.). Geo-Spatial Technologies in
Remote Sensing, [S.l.], v. 50, n. 9, p. 3409-3424, 2012. Urban Environments: Policy, Practice and Pixels. 2. ed. Heidelberg:
Springer-Verlag, 2007. p. 141-176.
DORREN, L.; MAIER, B.; SEIJMONSBERGEN, A. Improved Landsat-
Based Forest Mapping in Steep Mountainous Terrain Using HEALEY, S. P. et al. Comparison of Tasseled Cap-based Landsat
Object-Based Classification. Forest Ecology and Management, Data Structures for Use in Forest Disturbance Detection. Remote
[S.l.], v. 183, n. 1-3, p. 31-46, 2003. Sensing of Environment, [S.l.], v. 97, n. 3, p. 301-310, 2005.
DU, Y.; TEILLET, P. M.; CIHLAR, J. Radiometric Normalization of HEGAZY, I. R.; KALOOP, M. R. Monitoring Urban Growth and
Multitemporal High-Resolution Satellite Images with Quality Land Use Change Detection with GIS and Remote Sensing
Control for Land Cover Change Detection. Remote Sensing of Techniques in Daqahlia Governorate Egypt. International Journal
Environment, [S.l.], v. 82, p. 123-134, 2002. of Sustainable Built Environment, [S.l.], v. 4, p. 117-124, 2015.
DURUPT, M.; TAILLANDIER, F. Automatic Building Reconstruction HEIDEN, U.; SEGL, K.; KAUFMANN, H. Determination of Robust
from a Digital Elevation Model and Cadastral Data: An Operational Spectral Features for Identification of Urban Surface Materials
Approach. 2006. Disponvel em: <http://www.isprs.org/ in Hyperspectral Remote Sensing Data. Remote Sensing of
proceedings/XXXVI/part3/singlepapers/O_14.pdf>. Acesso em: Environment, [S.l.], v. 111, n. 4, p. 537-552, 2007.
25 nov. 2016.
HEO, J.; FITZHUGH, T. W. A Standardized Radiometric Normalization
ELVIDGE, C. D. et al. Relative Radiometric Normalization of Landsat Method for Change Detection Using Remotely Sensed Imagery.
Multispectral Scanner (MSS) Data Using an Automatic Scattergram- Photogrammetric Engineering and Remote Sensing, Bethesda,
Controlled Regression. Photogrammetric Engineering and Remote v. 66, n. 2, p. 173-181, 2000.
Sensing, Bethesda, v. 61, p. 1255-1260, 1995.
HEROLD, M. et al. Spectrometry for Urban Area Remote Sensing
FRANKE, J. et al. Hierarchical Multiple Endmember Spectral Development and Analysis of a Spectral Library from 350 to
Mixture Analysis (MESMA) of Hyperspectral Imagery for Urban 2400 nm. Remote Sensing of Environment, [S.l.], v. 91, n. 3-4, p.
Environments. Remote Sensing of Environment, [S.l.], v. 113, n. 8, 304-319, 2004.
p. 1712-1723, 2009.
HOBI, M. L.; GINZLER, C. Accuracy Assessment of Digital Surface
Models Based on WorldView-2 and ADS80 Stereo Remote
Sensing Data. Sensors, [S.l.], v. 12, p. 6347-6368, 2012.
Setembro/Dezembro 2016 94
Artigos
JARIHANI, A. A. et al. Satellite-Derived Digital Elevation Model MENG, X.; CURRIT, N.; ZHAO, K. Ground Filtering Algorithms for
(DEM) Selection, Preparation and Correction for Hydrodynamic Airborne LiDAR Data: A Review of Critical Issues. Remote Sensing,
Modelling in Large, Low-Gradient and Data-Sparse Catchments. [S.l.], v. 2, p. 833-860, 2010.
Journal of Hydrology, [S.l.], v. 524, p. 489-506, 2015.
MENKE, A. B. et al. Anlise das mudanas do uso agrcola da terra
JAT, M. K.; GARG, P. K.; KHARE, D. Monitoring and Modelling of Urban a partir de dados de sensoriamento remoto multitemporal no
Sprawl Using Remote Sensing and GIS Techniques. International municpio de Luis Eduardo Magalhes (BA-Brasil). Sociedade &
Journal of Applied Earth Observation and Geoinformation, [S.l.], Natureza, Uberlndia, v. 21, n. 3, p. 315-326, 2009.
v. 10, n. 1, p. 26-43, 2008.
MIRANDA, A. C. O.; MATOS; C. R. Potencial uso do BIM na
JENSEN, J. R. et al. An Evaluation of Coastwatch Change Detection fiscalizao de obras pblicas. Revista do Tribunal de Contas da
Protocol in South Carolina. Photogrammetric Engineering and Unio, Braslia, DF, v. 133, p. 22-31, 2015.
Remote Sensing, Bethesda, v. 59, n. 4, p. 519-525, 1993.
MUSA, Z. N.; POPESCU, I.; MYNETT, A. A Review of Applications of
JENSEN, J. R.; COWEN, D. C. Remote Sensing of Urban/Suburban Satellite SAR, Optical, Altimetry and DEM Data for Surface Water
Infrastructure and Socio-Economic Attributes. Photogrammetric Modelling, Mapping and Parameter Estimation. Hydrology and
Engineering and Remote Sensing, Bethesda, v. 65, p. 611-622, 1999. Earth System Sciences, [S.l.], v. 19, p. 3755-3769, 2015.
JOHNSON, R. D.; KASISCHKE, E. S. Change Vector Analysis: A MYINT, S. et al. Per-Pixel vs. Object-Based Classification of Urban
Technique for the Multispectral Monitoring of Land Cover and Land Cover Extraction Using High Spatial Resolution Imagery.
Condition. International Journal of Remote Sensing, Londres, v. Remote Sensing of Environment, [S.l.], v. 115, n. 5, p. 1145-1161,
19, p. 3, n. 411-426, 1998. 2011.
KIM, M.; MADDEN, M.; XU, B. GEOBIA Vegetation Mapping in Great NIELSEN, A. A.; CONRADSEN, K.; SIMPSON, J. J. Multivariate
Smoky Mountains National Park with Spectral and Non-Spectral Alteration Detection (MAD) and MAF Postprocessing in
Ancillary Information. Photogrammetric Engineering and Remote Multispectral, Bitemporal Image Data: New Approaches to
Sensing, Bethesda, v. 76, n. 2, p. 137-149, 2010. Change Detection Studies. Remote Sensing of Environment,
[S.l.], v. 64, p. 1-19, 1998.
KIM, M.; MADDEN, M.; WARNER, T. Forest Type Mapping Using
Object-Specific Texture Measures from Multispectral IKONOS OLIVEIRA, S. N et al. Deteco de mudana do uso e cobertura da
Imagery: Segmentation Quality and Image Classification Issues. terra usando o mtodo de ps-classificao na fronteira agrcola
Photogrammetric Engineering and Remote Sensing, Bethesda, do oeste da Bahia sobre o Grupo Urucuia durante o perodo
v. 75, n. 7, p. 819-830, 2009. 1988-2011. Revista Brasileira de Cartografia, Rio de Janeiro, v. 66,
n. 5, p. 1157-1176, 2014.
KIM, Z. W.; NEVATIA, R. Automatic Description of Complex Buildings
from Multiple Images. Computer Vision Image Understanding, v. PHINN, S. R. et al. Monitoring the Composition of Urban
96, p. 60-95, 2004. Environments Based on the Vegetation-Impervious Surface-Soil
(VIS) Model by Subpixel Analysis Techniques. International Journal
LAMBIN, E. F. Monitoring Forest Degradation in Tropical Regions of Remote Sensing, Londres, v. 23, n. 20, p. 4131-4153, 2002.
by Remote Sensing: Some Methodological Issues. Global Ecology
and Biogeography, [S.l.], v. 8, n. 3-4, p. 191-198, 1999. POLI, D.; TOUTIN, T. Review of Developments in Geometric
Modelling for High-Resolution Satellite Pushbroom Sensors.
LIU, D.; XIA, F. Assessing Object-Based Classification: Advantages Photogrammetric Record, [S.l.], v. 27, p. 58-73, 2012.
and Limitations. Remote Sensing Letters, Melbourne, v. 1, n. 4, v.
187-194, 2010. PUENTE, I. et al. Review of Mobile Mapping and Surveying
Technologies. Measurement: Journal of the International
LU, D. et al. Change Detection Techniques. International Journal of Measurement Confederation, [S.l.], v. 46, n. 7, p. 2127-2145, 2013.
Remote Sensing, Londres, v. 25, n. 12, p. 2365-2407, 2003.
SINGH, A. Digital Change Detection Techniques Using Remotely- VITAL, A. L. F. et al. Fiscobras: uma obra em construo. Revista do
Sensed Data. International Journal of Remote Sensing, Londres, Tribunal de Contas da Unio, Braslia, DF, v. 133, p. 32-39, 2015.
v. 10, p. 989-1003, 1989.
WEISMILLER, R. A. et al. Change Detection in Coastal Zone
SILVA, N. C. et al. Change Detection Software Using Self-Organizing Environments. Photogrammetric Engineering and Remote
Feature Maps. Revista Brasileira de Geofsica, [S.l.], v. 30, n. 4, p. 505- Sensing, Bethesda, v. 43, p. 1533-1539, 1977.
518, 2012.
WENTZ, E. A. et al. Supporting Global Environmental Change
SKAKUN, R. S.; WULDER, M. A.; FRANKLIN, S. E. Sensitivity of the Research: A Review of Trends and Knowledge Gaps in Urban
Thematic Mapper Enhanced Wetness Difference Index to Detect Remote Sensing. Remote Sensing, [S.l.], v. 6, n. 5, p. 3879-3905, 2014.
Mountain Pine Beetle Red-Attack Damage. Remote Sensing of
Environment, [S.l.], v. 86, p. 433-443, 2003. WU, C.; MURRAY, T. A. Estimating Impervious Surface Distribution
by Spectral Mixture Analysis. Remote Sensing of Environment,
SMALL, C. High Resolution Spectral Mixture Analysis of Urban [S.l.], v. 84, n. 4, p. 493-505, 2003.
Reflectance. Remote Sensing of Environment, [S.l.], v. 88, p. 170-
186, 2003. YADAV, P. K.; KAPOOR, M.; SARMA, K. Land Use Land Cover
Mapping, Change Detection and Conflict Analysis of Nagzira-
SONG, C. et al. Classification and Change Detection Using Landsat Navegaon Corridor, Central India Using Geospatial Technology.
TM Data: When and How to Correct Atmospheric Effects? Remote International Journal of Remote Sensing and GIS, Deli, v. 1, n. 2,
Sensing of Environment, [S.l.], v. 75, p. 230244, 2001. p. 90-98, 2012.
SOUZA, I. V. N.; BATISTA, H. M. Estudo dos benefcios econmicos YU, Q. et al. Object-Based Detailed Vegetation Classification with
gerados pelas fiscalizaes de obras pblicas, realizadas pelo Airborne High Spatial Resolution Remote Sensing Imagery.
Tribunal de Contas da Unio, no estado do Rio Grande do Norte, Photogrammetric Engineering and Remote Sensing, Bethesda,
no perodo de 2011 e 2012. 2013. 67 f. (Trabalho de Concluso de v. 72, n. 7, p. 799-811, 2006.
Curso) Departamento de Cincias Contbeis da Universidade
Federal do Rio Grande do Norte, Natal, 2013. YUAN, F. et al. Land Cover Classification and Change Analysis of
the Twin Cities (Minnesota) Metropolitan Area by Multitemporal
SUN, C. et al. Quantifying Different Types of Urban Growth and the Landsat Remote Sensing. Remote Sensing of Environment, [S.l.],
Change Dynamic in Guangzhou Using Multi-Temporal Remote v. 98, n. 2, p. 317-328, 2005.
Sensing Data. International Journal of Applied Earth Observation
and Geoinformation, [S.l.], v. 21, p. 409-417, 2013. ZOMER, R. J.; TRABUCCO, A.; USTIN, S. L. Building Spectral Libraries
for Wetlands Land Cover Classification and Hyperspectral Remote
TEWKESBURY, A. P. et al. A Critical Synthesis of Remotely Sensed Sensing. Journal of Environmental Management, [S.l.], v. 90, n. 7,
Optical Image Change Detection Techniques. Remote Sensing p. 2170-2177, 2009.
of Environment, [S.l.], v. 160, p. 1-14, 2015.
ZULLO JNIOR, J. Correo atmosfrica de imagens de satlite e
THOMAS, N.; HENDRIX, C.; CONGALTON, R. G. A Comparison of aplicaes. 1994. 191 p. Tese (Doutorado em Engenharia Eltrica)
Urban Mapping Methods Using High-Resolution Digital Imagery. Universidade Estadual de Campinas, Campinas, 1994.
Photogrammetric Engineering and Remote Sensing, Bethesda,
v. 69, n. 9, p. 963-972, 2003.
Setembro/Dezembro 2016 96
Artigos
Implementao de um
geocatlogo para auxlio na
localizao e recuperao de
dados geogrficos abertos
retranca imagem
A INDE-BR consiste em uma iniciativa de Consortium (OGC). Alguns desses padres definem
criao de uma arquitetura para disseminao e re- o funcionamento dos geosservios, que permitem a
gramento do uso de dados geogrficos no mbito obteno de mapas cartogrficos, mapas temticos,
da administrao pblica. Cabe ressaltar um dos dados geogrficos e metadados.
objetivos definidos na sua concepo, o de Um dos componentes essenciais numa ar-
quitetura de IDE o catlogo de servios. A meto-
evitar a duplicidade de aes e o desperdcio de dologia SERVUS de desenvolvimento de sistemas
recursos na obteno de dados aeroespaciais pelos (USLNDER, 2010), feita especialmente para tra-
rgos da administrao pblica, por meio da tar do uso e composio de servios geoespaciais,
divulgao dos metadados relativos a esses dados prope a utilizao de um geocatlogo semntico
disponveis nas entidades e nos rgos pblicos das para auxlio na localizao de recursos geogrficos
esferas federal, estadual, distrital e municipal (BRASIL, em rede.
2008). Para estudar esse aspecto, este documento foi
dividido da seguinte forma: na Seo 2 so apre-
Camboim (2013) ressalta a iniciativa gover- sentados alguns trabalhos correlatos; na Seo 3
namental de criao da Infraestrutura Nacional de apresentada a fundamentao terica, tratando
Dados Abertos (INDA) e do Portal Brasileiro de Da- dos temas IDE e metodologia SERVUS; na Seo 4
dos Abertos como uma estratgia de adoo de Da- apresentado o modelo proposto, detalhes do ge-
dos Interligados Abertos (Linked Open Data). Esse ocatlogo e um exemplo de utilizao com a me-
autor prope uma arquitetura capaz de tornar os todologia SERVUS e, por fim, na Seo 5 temos as
dados da INDE-BR disponveis na INDA de forma concluses.
integrada. Essa proposta de arquitetura destaca-se
pelo uso de camadas semnticas e ontologias, fa- 2. TRABALHOS CORRELATOS
zendo uma juno de tcnicas da web semntica
com dados geoespaciais, ingressando no campo da Andrade e Baptista (2011) trilharam um cami-
geossemntica. nho que inclua busca semntica, listagem de gran-
As arquiteturas das IDE atuais so, via de de quantidade de informaes oriundas de fontes
regra, orientadas a servio e adotam os padres diversas, estabelecimento de mtricas e gerao
tecnolgicos estabelecidos pela Open Geospatial de um ranking de recursos disponibilizados numa
Setembro/Dezembro 2016 98
Artigos
infraestrutura de dados espaciais. Os autores parti- anlise dos dados geogrficos, de uma forma pa-
ram do pressuposto de que o uso de ontologias seria dro e interopervel. Tambm consideram a ne-
o caminho para tornar mais precisas as buscas e fa- cessidade de que esses dados estejam disponveis
cilitar o processo de automatizao. Como contri- em rede, por meio de um conjunto de sistemas que
buies, tivemos o estabelecimento de uma mtrica utilizem protocolos e interfaces padres, propician-
combinada e a construo de uma rede semntica. do a criao de aplicaes que possam ser vistas
Daltio e Carvalho (2012) propuseram a cons- pelo usurio como um nico sistema. IDE pode ser
truo de um framework para a recuperao semntica classificada como uma estrutura de componentes
de dados espaciais. O framework era baseado em um tecnolgicos, geogrficos, sociais e polticos con-
processo de anotao semntica dos recursos geogr- forme ilustrado na Figura 1.
ficos e na utilizao de um servio de gerenciamento O componente tecnolgico representado
de ontologias. Cabe ressaltar neste trabalho a impor- por uma arquitetura baseada em padres de in-
tncia dada ao processo de seleo das ontologias. teroperabilidade e capaz de compartilhar dados e
Gimenez, Tanaka e Baio (2013) apresentam informaes geogrficas. As linguagens de marca-
uma proposta de integrao semntica para a INDE- o XML e GML tm um papel fundamental nesse
-BR usando geo-ontologias de domnio incorpora- componente. O componente social representado
das em camadas semnticas atuando sobre as IDEs. por um conjunto de atores, dentre eles, produtores
de dados, provedores de servios, usurios, desen-
3. FUNDAMENTAO TERICA volvedores de software e responsveis por padres
e normas, alm de uma grande comunidade forma-
3.1 INFRAESTRUTURA DE DADOS da por empresas privadas, governo, universidades
ESPACIAIS (IDE) e a sociedade em geral. O componente geogrfi-
co representado pelos dados, seus metadados e
Bernab-Poveda e Lpez Vzquez (2012, p. os geosservios. O componente poltico repre-
57-59) conceituam Infraestrutura de Dados Espa- sentado pelas pessoas e pelo rgo responsvel
ciais (IDE) como uma infraestrutura necessria para por estabelecer o marco regulatrio e as regras de
o acesso, compartilhamento, troca, combinao e funcionamento.
Figura 1:
Componentes de uma IDE
POLTICO TECNOLGICO
LINGUAGENS
RGO MARCO NORMAS E PADRES
PADRES DE
GESTOR LEGAL DE
MARCAO
INTEROPERABILIDADE
(XML-GML)
GEOGRFICO SOCIAL
ATORES
DADOS METADADOS (PRODUTORES, PROVEDORES,
DESENVOLVEDORES, COLABORADORES,
INTERMEDIRIOS E USURIOS FINAIS)
SERVIOS COMUNIDADE
(EMPRESAS PRIVADAS,UNIVERSIDADES,
ADMINISTRAO PBLICA, PARTICULARES)
Figura 2:
Hierarquia de modelos SERVUS
MODELOS DE
CAMADA
REQUISITOS
MODELOS DE
PROCESSO E
APLICAO CASO DE USO
USO DE CAPACIDADES
MODELOS DE
CAMADA DE SERVIO
PROJETO
SERVIOS
SERVIOS
SERVIOS
REDE DE GEOSSERVIOS
A metodologia composta por uma lingua- Facility (MOF). As principais metaclasses so: fei-
gem de modelagem, um processo de desenvolvi- o (feature), interface, servio e recurso. O modelo
mento e uma arquitetura de referncia. Durante o conceitual composto por trs subconjuntos de
processo de desenvolvimento so criados artefatos metaclasses, o primeiro est associado viso de
tais como: um modelo de domnio, um modelo de servio, o segundo viso de informao e o tercei-
processos/casos de uso e um modelo de projeto. O ro viso de recurso. O modelo de projeto pode ser
modelo de projeto o principal deles e expressa os visto como uma composio de trs modelos: o de
requisitos e as capacidades sob a forma de recur- requisitos (REQs), o de capacidades (CAPs) e o de
sos. Os modelos gerados so baseados nas cama- mapeamento entre os dois primeiros (REQ2CAP).
das de abstrao propostas por Bieberstein (2006). A Figura 3 apresenta um quadro geral dos modelos
A Figura 2 exibe o mapeamento entre requisitos e e atividades da etapa de projeto.
capacidades, os modelos produzidos e a relao Segue a seguir uma descrio das principais
com as camadas de abstrao. atividades do processo de desenvolvimento.
O modelo de domnio da metodologia SER-
VUS representa o domnio temtico do problema a. Publishing: atividade, manual ou automa-
a ser resolvido. Ele formalmente define a parte do tizada, de busca de capacidades na rede de
mundo que compreende o universo de discurso en- servios geoespaciais e de incorporao ao
tre o usurio e o projetista do sistema, isto , com- modelo de capacidades. As capacidades so
preende o conhecimento compartilhado acerca do traduzidas para recursos ofertados, ou seja,
domnio da aplicao. Tipicamente esses conheci- disponveis na rede de geosservios;
mentos compartilhados so representados pela es-
pecificao de uma ontologia (USLNDER, 2010). b. Rephrasing: atividade responsvel por tra-
O modelo de referncia composto por um duzir os requisitos, de forma a extrair um
framework arquitetural, responsvel pelas orienta- conjunto de recursos necessrios para reali-
es e regras de como especificar o sistema, e por zao dos casos de uso, os recursos podem
um modelo conceitual. O modelo conceitual de ser associados aos conceitos de ontologia e
SERVUS um metamodelo segundo os preceitos em seguida carregados na rede de recursos se-
de Model Driven Architecture (MDA) e Meta-Object mnticos, compondo o modelo de requisitos;
Anlise
Modelo
de domnio
Refere-se ao Descoberta
Requisitos
Feedback Reformulao (Discovery)
generation (Rephrasing)
Modelo de requisitos
Modelo de requisitos
para capacidades
Modelo
de projeto
Modelo de capacidades
Publicao Grounding
(publishing) Combinao
Refere-se ao (Matching)
Atividade de projeto
c. Discovery: atividade responsvel por sele- que se refere ao suporte metodologia, o catlogo
cionar, no rol de capacidades levantadas na semntico responde pelas atividades de harvesting,
fase publishing, um conjunto que atenda aos que consiste na coleta de metadados dos servios,
recursos solicitados levantados na fase de re- e de publishing, publicao dos recursos disponveis
phrasing, para cada recurso requisitado pode para uma rede de recursos semnticos.
existir um conjunto de recursos ofertados que
atendam s necessidades; 6. MODELO PROPOSTO
Figura 4:
Arquitetura de
implementao NUVEM
Camada de GRAPHENEDB
Negcio - Amazon
HTTP EC2
REST VM Linux - Ubuntu HTTP Banco de
JSON Servidor de Aplicao REST grafos
Jetty JSON Neo4J
Maquina Virtual Java
Camada de
Apresentao
HTML
Bibliotecas Javascript
(Bootstrap
JQuery, GoogleMaps)
Figura 5:
Modelo de busca do catlogo
A arquitetura escolhida para implementao tional State Transfer) que retorna documentos no
do prottipo do geocatlogo foi a de uma apli- formato JSON (JavaScript Object Notation). A ca-
cao web de trs camadas. A camada de apre- mada de negcio foi hospedada num servio de
sentao foi desenvolvida em HTML5 utilizando nuvem EC2 da Amazon. A camada de persistncia
bibliotecas JavaScript: Bootstrap 3.3.5, jQuery 2.1.0, foi implementada atravs de um banco de dados
Google Maps 3.0 e o componente bootstrap-slider.js. NoSQL de grafos, o Neo4J 2.3.1. A hospedagem
A camada de negcio foi implementada em Java da camada de persistncia foi realizada na pgi-
verso 1.7 e a aplicao empacotada no formato na web GrapheneDB, que implementa os bancos
de web archive WAR. As requisies da camada Neo4J num ambiente de nuvem. A comunicao
de apresentao so feitas pelo protocolo http e entre camada de negcio e camada de persistncia
acessam um servidor padro REST (Representa- tambm ocorre por meio de interfaces REST e no
Tabela 1:
Clculo do ndice de relevncia
formato JSON. A Figura 4 representa a arquitetura mento de gerao do ranking. A Figura 5 apresenta
implementada. o modelo de busca do geocatlogo.
As consultas podem ser realizadas por des- O resultado efetivo de uma busca depende
crio (texto livre), palavras-chave e por termos das da qualidade dos metadados e do valor de negcio
ontologias. Para cada um dos itens anteriores as atribudo a cada campo. Para lidar com esse aspec-
frases ou termos so divididos em tokens que sero to foi elaborado um esquema de ponderao dos
os termos utilizados na busca. Podem ser realiza- campos de pesquisa e dos campos de metadados e
das filtragens por coordenadas geogrficas (filtro o estabelecimento de um ndice de relevncia que
espacial) e por ano (temporal). Para cada par orde- serve de base para o processo de gerao do ranking
nado, composto pelo termo e o campo pesquisado, de resultados. A Tabela 1 apresenta um exemplo de
atribudo um peso que ser a base para o procedi- clculo do ndice de relevncia.
Figura 6:
Tela de busca do
geocatlogo
Figura 7:
reas de proteo
ambiental importadas
para ferramenta QGIS
Os registros dos recursos so recuperados me- dos aspectos da implantao tais como: arquitetura
diante requisies REST para o banco de dados re- e modelo de dados. No que se refere arquitetura,
moto, compostas pelos comandos na linguagem o geocatlogo foi implementado como uma aplica-
Cypher. Os principais tipos de interao so: consul- o web de trs camadas, passvel de implantao
ta a ontologias, criao de relacionamentos entre os em ambiente de nuvem. O modelo de dados foi im-
recursos e gerao do ranking dos recursos geogr- plementado em banco de dados orientado a grafos.
ficos. A Figura 6 exibe o ranking na forma de uma O geocatlogo se mostrou vivel como ferra-
listagem com os links para visualizao do recurso, menta de busca de recursos geogrficos e de apoio
download e visualizao dos metadados. metodologia SERVUS, possibilitando a atuao
Para validao do uso do geocatlogo foram nas etapas de publishing e matching. Podem ser con-
utilizadas as etapas da metodologia SERVUS, utiliza- sideradas como contribuies a utilizao da lin-
mos como base um problema relacionado a uma au- guagem Cypher no manuseio de rede de recursos,
ditoria na rea ambiental, que assim apresentamos: ontologias e metamodelo, de forma integrada, em
como obter os dados necessrios, a nvel brasileiro, banco de dados no relacionais orientado a grafos. O
para o levantamento da localizao de reas de pro- estabelecimento de mecanismos de parametrizao
teo ambiental, utilizando como base os geosser- das consultas, mediante ponderao de parmetros
vios disponveis na rede de infraestrutura de dados e campos de metadados e o estabelecimento de um
espaciais nacional, de instituies e rgos pblicos? ndice de relevncia, so contribuies para o cam-
O resultado final foi a localizao e visuali- po da busca em bases de metadados. Como traba-
zao dessas reas. A Figura 7 apresenta as reas de lhos futuros, podemos considerar a automatizao
proteo ambiental localizadas pelo geocatlogo, do processo harvesting e a integrao com uma in-
cujos dados foram baixados de servios WFS e im- fraestrutura de dados espaciais corporativa, de for-
portados para a ferramenta Quantum GIS. ma que o geocatlogo atue conjuntamente com os
geoportais.
7. CONCLUSO
REFERNCIAS
Este artigo abordou aspectos da implementa-
o de um geocatlogo que possibilita a utilizao ANDRADE, F. G.; BAPTISTA, C. S. Using semantic
de ontologias como parmetros de pesquisa. As con- similarity to improve information discovery in spatial
sultas so realizadas nos metadados de geosservios data infrastructures. Journal of Information and Data
de infraestruturas de dados espaciais. Foram aborda- Management, v. 2, n. 2, p. 181, 2011.
1. INTRODUO
retranca imagem
mais crtico, como pode-se inferir do trecho do relatrio A 2 edio do guia de Governana do TCU
trimestral abaixo: (2015) traz um resumo da interao entre a gesto e a
governana:
[C]hegou-se ao consenso dos trs principais desafios So funes da governana:
que o tribunal dever superar para obter bons resultados
com a anlise de dados: o desafio tcnico, especialmente a. definir o direcionamento estratgico;
vinculado qualidade dos dados; o regulatrio, atinente
s restries legais e normativas; e o cultural, concernente b. supervisionar a gesto;
aos aspectos comportamentais das pessoas envolvidas
(RELATRIO TRIMESTRAL TCU 4 TRIMESTRE/2014, p. 101). c. envolver as partes interessadas;
Figura 1:
TCU - Referencial bsico de Governana aplicvel a rgos e entidades da Administrao Pblica, 2 edio, p. 32
Figura 2:
Diferentes nveis de governana gravitando simultaneamente
Figura 4:
Modelo de ciclo de
dados, adaptado
(HENDERYCKX, 2016)
laboratrio de explorao e cruzamento de dados ex- sunto) s agora est ganhando energia, visto que as empre-
ternos e internos. sas e organizaes que dependem de dados querem extrair
A rea responsvel por esse laboratrio adota, o mximo valor desse ativo, cada vez mais abundante e
quando necessrio, o Princpio da Oportunidade, que mais complexo. Cabe lembrar que j podem existir reas
justifica a incluso ad hoc de novas bases, mesmo antes que governam bem seus dados. Nesses casos, segundo o
de haver tratamentos de qualidade e documentao poltico ingls Lucius Cary, quando no necessrio mu-
mais detalhados. O motivo no deixar, no contexto dar, necessrio no mudar (In: SEINER, 2014).
de alguma auditoria, a janela da oportunidade de anlise A matria-prima para o trabalho de qualquer r-
passar. A partir da, porm, tal base torna-se elegvel a go de controle informao. E seus produtos finais
um processo de tratamento mais completo. (determinaes, recomendaes) so fontes primrias
Alm disso, existe a questo contextual. Bases de informao a todos os seus auditados.
externas de baixa qualidade podem ser teis para se
descobrir achados de auditoria em sistemas de infor- 5. GOVERNANA DE DADOS
mao, enquanto bases derivadas de boa qualidade,
com documentao completa de metadados, facilita a Finalmente chegamos a uma definio formal,
anlise relativa ao uso efetivo dos repasses de recursos segundo John Ladley (2012):
financeiros, por exemplo.
Quando o modelo apresentado tem baixa quali- Governana de dados a organizao e implementao de
dade e organizao, surgem problemas em trs momen- polticas, procedimentos, estrutura, papis e responsabilidades
tos (DYKES, 2016): que delineiam e reforam regras de comprometimento,
direitos decisrios e prestao de contas para garantir o
a. as pessoas no confiam nos dados a priori; gerenciamento apropriado dos ativos de dados.
b. h tantas fontes que no se sabe o que usar; e Da definio, discutiremos brevemente a necessi-
dade de princpios, polticas, curadores de dados e clas-
c. h paralisia de anlise, quando difcil saber
quando a anlise est boa o suficiente.
4. GESTO DE DADOS
Tabela 1:
Lista de alguns princpios para implantao de Governana de Dados
Princpios Descrio
Regra de ouro Todos os dados so tratados como ativo corporativo.
Federao H padres definidos para as estruturas de dados.
Eficincia Dados relevantes devem estar disponveis no momento certo, no lugar certo e no formato certo para usurios autorizados.
Qualidade Dados corporativos so medidos e geridos para terem qualidade.
Gesto de risco Manter conformidade com a legislao, polticas e normativos internos relativos a dados.
Colaborao Dados corporativos so recursos compartilhados e publicizados.
Contextualizao O contexto de uso do dado muda sua forma de armazenamento, tratamento e utilizao.
Inovao Novas tcnicas so incentivadas, seguindo-se os demais princpios.
Cada corporao tem sua cultura e necessidades, b. CDO interagindo com TI e uma rea de gesto
e no faria sentido haver apenas uma forma de estrutura de dados central do negcio;
Figura 7:
Exemplo editado de metadados tcnicos integrados
c. CDO interagindo com TI e vrias reas de gesto A estrutura hbrida particularmente interes-
de dados do negcio; ou sante, e utilizada na prtica em um grande banco mul-
tinacional (IPPOLITI, 2016). Dada a grande variedade
d. um CDO para cada grande linha de negcio, in- interna de dados disponveis, eles resolveram dividir a
teragindo com TI (hbrido). gesto desses em grandes linhas de negcio (figura 9).
a. Comando e controle;
b. Tradicional; e
c. No-invasivo.
Figura 9:
Estrutura hbrida, adaptado (IPPOLITI, 2016)
Por fim, a no-invasiva formaliza a curadoria ditor-Geral do Canad, em que esse um problema
tcita, foca em aplicar os processos existentes, esti- a ser combatido:
mula construo de ferramentas e uso das atuais e
mede resultado pelo aumento percebido em eficin- Um dos temas que unem muitas de nossas auditorias
cia e efetividade de capacidades de anlise. que os dados coletados de muitas organizaes
Como j frisamos, nenhuma necessariamen- governamentais ou so inutilizveis, ou no so usveis
te melhor que a outra. Depende da cultura e neces- ou no so utilizados (Auditor-Geral do Canad em
sidades de cada organizao. ROWLANDS, 2016).
BRASIL. LEI n 12.527, de 18 de novembro de 2011. Lei IPPOLITI, J. Implementing Data Governance Strategies.
de Acesso Informao. Disponvel em: <http://www. In: ENTERPRISE DATA GOVERNANCE ONLINE, 2016. Anais
planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/ eletrnicos 20 slides. Disponvel em: <http://video.
l12527.htm>. Acesso em: 20 out. 2016. 2011. dataversity.net/video/keynote-implementing-data-
governance-strategies/>. Acesso em: 12 fev. 2016.
BRASIL, TCU TRIBUNAL DE CONTAS DA UNIO.
Referencial bsico de governana aplicvel a rgos e LADLEY J. Data Governance: How to Design, Deploy
entidades da administrao pblica. Verso 2 Braslia: and Sustain an Effective Data Governance Program.
Tribunal de Contas da Unio. Secretaria de Planejamento, The Morgan Kaufmann Series on Business Intelligence.
Governana e Gesto. 80p. Disponvel em: <http://www. Morgan Kaufmann. 2012.
tcu.gov.br/governanca>. Acesso em: 20 out. 2016. 2014.
RGO, B. L. Gesto e Governana de Dados: Promovendo
______. Relatrio de Atividades: 4 trimestre de 2014 Dados Como Ativo de Valor Nas Empresas. Rio de Janeiro:
Braslia: Tribunal de Contas da Unio. Secretaria-Geral da Brasport, p. 60-74. 2013.
Presidncia, p.101. Disponvel em: <http://portal.tcu.gov.
br/publicacoes-institucionais/relatorios/relatorios-de- ROWLANDS, I. Data Management in Motion. In: DATA
atividades>. Acesso em: 20 out. 2016. 2015. MANAGEMENT CONFERENCE LATIN AMERICA, 2016, So
Paulo. Anais eletrnicos. So Paulo. DAMA Brasil, 2016.
______. Vocabulrio de Controle Externo do Tribunal de 25 slides. Disponvel em: <http://www.dmc-latam.com/
Contas da Unio Braslia: Tribunal de Contas da Unio. palestrantes/ian-rownlands/>. Acesso em: 19 set. 2016.
Instituto Serzedllo Corra. Disponvel em: <http://
portal.tcu.gov.br/vocabulario-de-controle-externo/>. SEINER, R. Non-Invasive Data Governance: The Path
Acesso em: 20 out. 2016. 2015. of Least Resistance and Greatest Success. Technics
Publications. 2014.
CANAD, Office of the Auditor General of Canada
OAG. Spring Reports of the Auditor General of Canada. ______. Comparing Approaches to Data Governance.
Auditor Generals Opening Statement. Disponvel Disponvel em: <http://tdan.com/comparing-
em: <http://www.oag-bvg.gc.ca/internet/English/ approaches-to-data-governance/20386>. Acesso em:
osm_20160503_e_41358.html>. Acesso em: 20 out. 5 out. 2016.
2016. 2016.
SE TZER, V. W. Dado, informao, conhecimento e
D M B O K . M O S L E Y, M . ; B R A C K E T T, M . ; E A R L E Y, S . competncia. Journal Data & Information 1(1), DAMA
HENDERSON, D. DAMA Guia para o cor po de Brasil: p. 38-55. 2015.
conhecimento em gerenciamento de dados. Technics
Publications, verso brasileira 2012. VANIAN, J. Why Data Is The New Oil. Fortune, Brainstorm
Tech. Disponvel em: <http://fortune.com/2016/07/11/
DYKES, B. Big Data Paralyzing Your Business? Avoid These data-oil-brainstorm-tech/>. Acesso em: 20 out. 2016.
3 Common Traps. Forbes, Entrepreneurs. Disponvel em: Julho de 2016.
<http://www.forbes.com/sites/brentdykes/2016/09/28/
big-data-paralyzing-your-business-avoid-these -3- WODZINSKI, M. et al. Building an I mpactful Data
common-traps/>. Acesso em: 20 out. 2016. Governance Program One Step at a Time. Disponvel em:
<https://www.brighttalk.com/webcast/10477/142503/
HENDERYCKX, J. Sustaining Data Driven Innovation. In: building-an-impactful-data-governance-program-one-
DATA MANAGEMENT CONFERENCE LATIN AMERICA, step-at-a-time>. Acesso em: 26 fev. 2015.
2016, So Paulo. Anais eletrnicos So Paulo: DAMA
Brasil, 2016. 42 slides. Disponvel em: <http://www.dmc-
latam.com/palestrantes/jan-henderyckx/>. Acesso em:
19 set. 2016.
retranca imagem
Uma vez que essa autora considera o cadas- O cadastro de reas pblicas deve seguir o padro
tro municipal como uma ferramenta que deve ir alm dos demais cadastros tcnicos brasileiros, devendo pos-
do aspecto tributrio, devendo participar no plane- suir, no mnimo, considerando diretiva do Infrastructure
jamento, controle urbano e ordenamento territorial, for Spatial Information in Europe (Inspire), as seguintes
destaca-se: informaes: geometria da parcela, identificador ni-
co, referncia geodsica e ndice das parcelas para im-
O cadastro multifinalitrio definido por Dale & McLaughlin presso/publicao (PIMENTEL; CARNEIRO, 2012, p.
(1990) como um sistema de informaes territoriais 210). Nesse aspecto, ao criar um cadastro de reas p-
projetado para servir tanto a organizaes pblicas como blicas, estas devem estar aptas a se integrar aos demais
privadas, alm de servir aos cidados. Difere dos demais cadastros municipais contendo tambm esses dados.
sistemas de informaes territoriais por ser baseado em Para fins didticos e de entendimento, adota-se
parcelas. Serve de base para os demais tipos de cadastro o conceito de parcela cadastral definida pela Portaria n
(legal, fiscal etc) (CARNEIRO, 2003, p. 24). 511/2009, que trata toda e qualquer propriedade como
unidade a ser incorporada no CTM, inclusive os bens
Em consonncia com o pensamento de um cadas- pblicos, o que se transcreve a seguir:
tro territorial nas cidades, est Erba (2005, p. 21), que
demonstra uma declarao da Federao Internacional Art. 2 A parcela cadastral a menor unidade do cadastro,
de Gemetras em suas palavras a seguir: definida como uma parte contgua da superfcie terrestre
com regime jurdico nico.
Em concordncia com esta ltima afirmao est a
Declarao sobre o Cadastro redigida pela FIG, em 1995, 1 considerada parcela cadastral toda e qualquer poro
que afirma que o Cadastro um sistema de informao da superfcie no municpio a ser cadastrada.
territorial, normalmente baseado em parcelas, que
registra interesses sobre a terra, como direitos, restries e 2 As demais unidades, como, lotes, glebas, vias pblicas,
responsabilidades. Ainda acrescenta que o Cadastro pode praas, lagos, rios e outras, so modeladas por uma ou mais
ser estabelecido para arrecadao, legal e, ou, de apoio parcelas de que trata o caput deste artigo, identificadas por
ao planejamento, buscando sempre o desenvolvimento seus respectivos cdigos.
social e econmico, destacando, porm, que no existe
a necessidade de pensar em um Cadastro uniforme para 3 Dever ser atribudo a toda parcela um cdigo nico
todos os pases ou jurisdies. e estvel.
Em seu art. 3, a referida Portaria do Ministrio caractersticas prprias do regime jurdico e legislativo
das Cidades explica que toda e qualquer poro da su- brasileiro, o que implica a necessidade de adequao do
perfcie territorial no municpio deve ser cadastrada em levantamento dos bens pblicos tambm nesse sentido.
parcelas, o que nos remete a partir da legislao para Esse autor tambm aborda a questo da responsabilida-
composio de um CTM que, dependendo da situao, de dos ordenadores territoriais no tocante observao
pode exigir o cadastro das parcelas das reas pblicas dos direitos e restries da propriedade, seja no meio
por meio de uma ou mais parcelas ou o que possibilitar urbano ou rural, o que se transcreve a seguir:
maior transparncia e preferncia dos cadastradores,
sendo estas parcelas identificadas por cdigos nicos. Um cadastro territorial baseado em parcelas observando
Segundo Pimentel e Carneiro (2012, p. 205), a de- os direitos, restries e responsabilidades da propriedade
finio da Federao Internacional de Gemetras retrata urbana ou rural, nos aspectos geomtricos, jurdicos,
claramente a questo da composio das informaes econmicos e de gesto, aqui no nosso pas, s na
no cadastro: atualidade est sendo ventilado e discutido interativamente
pelo poder pblico, instituies e comunidade cientfica,
Segundo definio da Federao Internacional de particularmente nos moldes da FIG e adequado realidade
Gemetras (FIG, 1995), a parcela a unidade territorial cultural do pas. Carecendo, no entanto, que as instituies
do cadastro e pode ser definida de muitas maneiras, e estudiosos perseverem na sua incluso em legislao
dependendo da sua finalidade para o cadastro. Por especfica explicitamente, com a designao da instituio
exemplo, uma rea com um tipo especfico de uso de terra; responsvel, regras e regulamentaes. (loc. cit.).
ou uma rea de domnio nico ou propriedade individual
ou de um grupo. Os limites podem ser formais ou informais Ao delimitar e cadastrar os bens imveis de uma
e para identificao dos polgonos utiliza-se um cdigo cidade, possvel atuar tambm na regularizao fun-
nico. diria, como apresenta Carneiro (2003, p. 25):
Esse autor recomenda, ainda, que qualquer ca- O trabalho de regularizao fundiria consiste em uma
dastro de parcelas territoriais deve ser multifinalitrio e srie de procedimentos tcnicos, jurdicos e administrativos
adotar padronizao, em suas palavras a seguir: (cadastro e levantamento topogrficos, anlise da origem
dominial do imveis, aes discriminatrias judiciais,
Indica-se que o levantamento das parcelas seja demarcaes, planos de legitimao de posses etc.), que
georreferenciado ao Sistema Geodsico Brasileiro, para
identificao inequvoca de seus limites. A projeo UTM
recomendada at que se defina uma projeo especfica
para cartografia em escala grande. (loc. cit.).
visam acabar com a incerteza dominial, separando as reas pessoal, ou real, de cada uma dessas entidades. (BRASIL,
devolutas das particulares e legitimando a posse e o uso 2002).
de terras pblicas.
Os bens pblicos possuem finalidade desde sua
No caso das reas pblicas, deve-se acrescentar aquisio ou recebimento e devem ser classificados a
outras informaes importantes a serem coletadas para partir de sua afetao (destinao). Conforme Di Pie-
compor o referido cadastro: tipo de bem pblico, legis- tro (2000 apud CARNEIRO, 2003, p. 99), necessita-se,
lao de uso e ocupao do bem, dimenso do terreno ainda, de uma separao no tocante aos bens imveis
e da edificao, identificador de correspondncia imo- prprios, definidos na legislao como especiais e do-
biliria dos limites fsicos, valor de aquisio e valor de minicais, e os bens de uso comum do povo, haja vista
avaliao, caso exista. que os primeiros servem de fomento para instalao
Os bens pblicos foram classificados pelo Cdi- de equipamentos e prestao de servios e o segundo
go Civil Brasileiro como dominicais, de uso comum do integra o patrimnio com a finalidade de preservao e
povo e de uso especial. Ainda de acordo com a referida conservao pelo poder pblico.
Lei, no art. 99: Conforme Carneiro (2003), em virtude da no
obrigatoriedade e desinteresse dos proprietrios de im-
Art. 99. So bens pblicos: veis em atualizarem os registros imobilirios, criou-se
uma dicotomia entre o que existe registrado nos CRI em
I os de uso comum do povo, tais como rios, mares, relao realidade dos imveis brasileiros, sejam eles de
estradas, ruas e praas; propriedade pblica ou privada. No caso dos bens pbli-
cos, estes frequentemente so passveis de ampliao,
II os de uso especial, tais como edifcios ou terrenos reduo e incorporao, hajam intervenes efetuadas
destinados a servio ou estabelecimento da administrao pelos municpios que muitas vezes no so informadas
federal, estadual, territorial ou municipal, inclusive os de nos CRI, implicando o abismo entre a realidade e o li-
suas autarquias; mite legal da propriedade.
Para Haar (1992 apud ERBA, 2005, p. 24), a di-
III os dominicais, que constituem o patrimnio das ferena entre o limite real e o limite de posse frequen-
pessoas jurdicas de direito pblico, como objeto de direito temente resulta em litgio, custos administrativos e
judiciais para a defesa e reintegrao da propriedade, o imveis gerou inmeras consequncias para a traje-
que transcreve-se a seguir: tria imobiliria histrica do Brasil, conforme explica
Erba (2005, p. 25) em parte de sua pesquisa a seguir:
Com relao ao cadastro, existem dois limites para as
parcelas: o limite legal, definido por Haar (1992) como uma No Brasil, grande parte dos trabalhos de medio efetuados
linha imaginria que no se pode localizar no terreno sem pelos profissionais de mensurao objetiva exclusivamente
um sinal que a materialize, exigindo para sua determinao levantar os fatos existentes, determinando assim somente
o estudo dos ttulos da parcela em questo, mais os ttulos os limites de posse das propriedades, desconhecendo
das propriedades vizinhas; e o limite da posse, que as causas legais correspondentes ao domnio efetivo.
determinado pelo uso do imvel, materializado por entes Este fato acaba provocando a generalizada e conhecida
naturais ou antropolgicos. situao de confuso de limites e sobreposio de ttulos
de propriedade. Este sistema tem como ponto fraco a
Em relao ao tpico anterior, prudente rela- falta de preciso causada pela subjetividade que existe
cionar e informar no ato de incorporao ao cadastro no momento em que se define o citado ponto de partida
a diferena entre o limite legal e o limite da posse, quando a parcela amarrada malha urbana. O fato de usar
uma vez que esses dados nem sempre so acresci- este tipo de referncia tem causado grandes problemas
dos no CRI de imediato, pois existem regras, custos nos sistemas de publicidade territorial de muitos pases,
e anuncia para o lanamento dessas atualizaes e gerando superposies de ttulos e conflitos de limites.
correes.
A partir da diferena entre os limites legais e de Para facilitar o balano contbil das cidades, reco-
posse, como ressaltam Carneiro (2003) e Erba (2005), menda-se incluir no ato do cadastro o valor de aquisio
implica-se tambm dizer que no existe a boa prtica do bem, visando a praticidade e agilidade na prestao
de atualizao das informaes nos CRI, esses ltimos de contas, como tambm possvel associar os investi-
que exigem para fins de atualizao e averbao o pa- mentos a cada patrimnio, facilitando a transparncia
gamento de taxas e emolumentos, alm da responsabi- dos gastos pblicos.
lidade tcnica. Contribui-se para essa necessidade as Normas
Em parte, essa dicotomia entre o cadastro mu- Brasileiras de Contabilidade Aplicada ao Setor P-
nicipal, os registros imobilirios e a realidade dos blico (NBCASP), institudas pelo Conselho Federal
de Contabilidade (CFC), que requerem das esferas ______. Ministrio das Cidades. Portaria n 511, de 7 de
pblicas uma prestao de contas dos investimen- dezembro de 2009. Diretrizes para a criao, instituio e
tos, visando a representar o valor real de cada bem atualizao do Cadastro Territorial Multifinalitrio (CTM) nos
pblico, o que tambm deve ser associado ao CTM municpios brasileiros. Dirio Oficial da Repblica Federativa
dos municpios. do Brasil, Braslia, DF, 8 dez. 2009, seo 1, p. 75.
1. INTRODUO
retranca imagem
para explorao e agregao de valor s informaes e 5.300 acrdos proferidos entre 2014 e 2015. O resul-
ao processo de tomada de deciso. tado obtido revelou preciso mdia de mais de 96%.
Esse fato implica significativo esforo por parte
dos servidores do Tribunal para estruturao desses da- 2. DESENVOLVIMENTO DOS TRABALHOS
dos e sistematizao de conhecimentos para uso e to-
mada de deciso. Exemplo disso o esforo requerido Dado o carter exploratrio e o pioneirismo de
para a realizao de determinadas atividades de gesto uso de tcnicas de inteligncia artificial no mbito do
e controle, como o monitoramento de deliberaes do TCU, o desenvolvimento dos trabalhos foi dividido
TCU e as iniciativas de classificao e triagem de pro- em etapas de experimentao com foco inicial para
cessos de Tomada de Contas Especial (TCE). processos de tomada de contas especial. Dado o car-
Nesse contexto, o uso de ferramentas e algorit- ter experimental, muitas das anlises realizadas foram
mos amparados em modelos de machine learning para descartadas para que a melhor soluo surgisse. Em que
automatizao da interpretao de documentos revela- pese essa orientao, o trabalho sempre teve presente
-se essencial e estratgico para classificao e extrao a ideia de replicao para outros objetos de controle e
automtica de informaes contidas em fontes de dados desafios de negcio.
no estruturados. A primeira etapa consistiu na obteno dos do-
As tcnicas de inteligncia artificial exploradas e cumentos de processos de Tomada de Contas Especial
sistematizadas nesse contexto permitem o aprendiza- diretamente do repositrio do GED (Gerenciamento
do de mquina das caractersticas mais complexas de Eletrnico de Documentos), com o propsito de estabe-
conceitos presentes em diferentes documentos. Com lecer uma base local para futura minerao das peas de
isso, pretende-se estruturar e tornar disponveis e teis TCE. O volume de documentos utilizados nessa etapa
informaes inicialmente dispersas em diferentes do- foi de cerca de 680 mil peas, e, para a extrao deles foi
cumentos e formatos. utilizado um algoritmo em linguagem Python para aces-
A ttulo de informao, o desenvolvimento de so ao banco de dados de desenvolvimento e ao GED em
experimentos iniciais com o uso de tcnicas de Deep produo com a finalidade de realizar download de todas
Learning revelou-se bastante promissor. O prottipo foi as peas em pastas relativas a cada processo de TCE. Essa
realizado no perodo de 1 de julho a 31 de dezembro etapa foi realizada no perodo de 20 a 24 de fevereiro de
de 2015, e a prova de conceito realizada utilizou como 2016, e o principal desafio enfrentado foi o fato de que
base de treinamento cerca de 257 mil acrdos de 1993 o download das peas foi frequentemente interrompido
a 2013 e classificou deliberaes contidas no texto de devido a problemas de conexo, e no foi possvel, no
incio, baixar todas as peas. No entanto, ao final, todas acelerar o processo de triagem e distribuio dos proces-
as peas de todos os processos de TCE foram baixadas. sos. O volume de documentos utilizados foram cerca de
Na segunda etapa, foi realizada a obteno da 680 mil peas, analisadas por meio de redes neurais do
base de dados do Cadastro de TCE em Apex e da base tipo Self-Organizing Maps, ou Kohonen Maps, median-
de Cadastro de TCE da CGU (Controladoria-Geral da te o software livre Somoclu em ambiente Linux. Essas
Unio), bem como os documentos de relatrios da CGU aes foram realizadas entre 4 e 10 de maro de 2016 e
em formato Word, com o propsito de compor a base de o principal desafio enfrentado foi o fato de que a grande
dados correlatos aos processos de TCE para realizao quantidade de documentos analisados demandou vrios
de minerao de texto nos documentos obtidos. O volu- dias consecutivos de processamento e a proporo en-
me de documentos utilizado nessa etapa foi de cerca de tre nmero de documentos que possuam classificao
2 mil peas e foi utilizado um script em SQL (Structured prvia para o nmero de documentos sem classificao
Query Language) para realizao dos dumps dos bancos seria muito discrepante para a obteno de um resulta-
de dados e acesso aos dados compartilhados da CGU do til. No obstante as dificuldades encontradas, foi
por compartilhamento da rede local. As aes dessa possvel classificar grande parte dos documentos por
etapa foram realizadas entre 2 e 3 de maro de 2016 e funo de governo usando por base o cadastro obtido
teve como principal desafio o fato de que nem todos os do sistema Apex utilizado at ento para as TCEs.
documentos em formato Word da CGU possuam meta- A quarta etapa foi a realizao da anlise das irre-
dados correspondentes no sistema de cadastro deles. Os gularidades dos processos da funo de governo Sade,
dados de cadastro do sistema em Apex correspondiam a com o propsito de classificar os processos enviados em
uma pequena frao do passivo existente de processos forma de planilha Excel que estavam pendentes de dis-
de TCE. Como resultado dessas aes, os dados baixa- tribuio. O volume de documentos analisados foi de
dos ficaram disponveis para anlise posterior. cerca de 3.146 peas por meio da tcnica de clustering
Na terceira etapa, foi realizado o agrupamento utilizando Self-Organizing Maps. Essa etapa foi realizada
das peas de processos de TCE de acordo com funo entre 11 e 21 de maro de 2016 e teve como principal
de governo e tipos de irregularidades constantes no sis- desafio o fato de que devido ao pequeno nmero de
tema de cadastro em Apex, com o propsito de tentar processos classificados previamente em relao ao to-
classificar automaticamente as peas no anotadas, que tal existente e conformao difusa das classificaes
compem a maioria dos processos, com a finalidade de de irregularidades, provavelmente o resultado no seria
Word; foram realizadas extraes de informaes nesses do Extrator de Deliberaes; servio REST de extrao
relatrios que permitiram preencher com boa preciso de entidades de relatrios de TCE; interface de valida-
uma minuta de instruo para o tipo de irregularidade o do Extrator de Contedo de TCE.
Omisso no dever de prestar contas; foram realizados A nona etapa, realizada entre 8 e 15 de julho de
cruzamentos das informaes extradas com sistemas 2016, teve como propsito a melhoria de documentos
estruturados, tais como o Sisobi, Siconv, Siafi; as mes- digitalizados por meio da utilizao de servios terceiri-
mas extraes realizadas em documentos em formato zados. Foi utilizada uma amostra de dez relatrios com
Word passou a ser realizada tambm para os relatrios grandes problemas de digitalizao, e a API Google Vi-
digitalizados em PDF, que so de menor qualidade de- sion foi utilizada para essa tentativa. O desafio principal
vido ao processo de OCR; foi disponibilizada uma in- era melhorar a qualidade do texto extrado dos documen-
terface de validao do extrator para os especialistas tos digitalizados de TCE sem recorrer a novo processo
em TCE. As extraes realizadas por esse experimento de digitalizao. No entanto, o resultado alcanado no
foram consideradas teis na gesto do estoque de TCE. foi melhor, em termos de quantidade de erros, do que o
Segundo os especialistas, o trabalho que realizado de software de OCR adotado no mbito do TCU (Adobe).
forma manual para este fim pode ser parcialmente au- A dcima etapa, entre 16 e 25 de julho de 2016,
tomatizado, reduzindo, assim, o tempo necessrio para teve como propsito o desenvolvimento da primeira
a distribuio/triagem de TCE. No entanto, a gerao verso do servio de reconhecimento de entidades men-
automtica de minutas foi considerada problemtica cionadas, NER (Named Entity Recognition), capaz de extrair
pelos especialistas devido ao fato de apresentarem da- de qualquer texto os nomes de pessoas fsicas, pessoas
dos que no preenchem totalmente as necessidades dos jurdicas, CPF, CNPJ e referncias normativas. O volume
auditores que instruem TCE. de documentos utilizados para treinar os modelos neurais
Na oitava etapa, realizada entre 27 de abril e 25 de reconhecimento de entidades foi de cerca de 58 mil
de maio de 2016, foram feitas as primeiras entregas com acrdos e a base Amaznia da Universidade de Lisboa,
o propsito de disponibilizar as primeiras verses dos contendo as anotaes manuais de cada tipo de entida-
servios previstos no cronograma do projeto. Conforme de mencionada. Para esse fim, foi utilizado o framework
cronograma do projeto de criao de servios cognitivos, de machine learning Apache OpenNLP em Python e Java,
esto disponveis para validao e acesso os seguintes com anotaes manuais e automticas em textos de acr-
produtos em sua primeira verso: servio REST de extra- dos. Com a utilizao de algoritmos de machine learning
o de deliberaes de acrdos; interface de validao no lugar de regras pr-definidas, a preciso e as demais
mtricas associadas podem no ser as ideais enquanto Indexing um mtodo estatstico que liga termos em
no houver uma grande quantidade de textos anotados uma estrutura semntica til, sem anlise sinttica ou
manualmente. A primeira verso do extrator de entidades semntica e sem interveno manual. Usando esse m-
genrico foi exposta como servio web na infraestrutura todo, cada documento representado no por termos,
de produo. Como foi separada uma base de valida- mas por conceitos que so verdadeira e estatisticamente
o no treinada de 10 mil sentenas aproximadamente independentes de uma forma que os termos no so.
para avaliar a qualidade do servio web NER, foi obtido
um score F1 de cerca de 81% para pessoas fsicas, o que 3. CONCLUSO
corresponde ao estado da arte em termos de extrao de
entidades mencionadas. A mtrica F1 a mais adequada Os servios cognitivos desenvolvidos podem ser
para demonstrar o equilbrio entre preciso e recall, que utilizados de forma bem-sucedida por outros sistemas,
deve ser o objetivo a ser buscado. com a finalidade de aprimorar os processos de trabalho
Na dcima primeira etapa, entre 1 de agosto do TCU e da Administrao Pblica, pois inerente
e 14 de setembro de 2016, ocorreu o desenvolvimen- ao trabalho do TCU e outros rgos a necessidade de
to da segunda verso do extrator de entidades genri- estruturar textos produzidos continuamente e que de-
co em Java puro, utilizando nativamente a biblioteca pendem da classificao e extrao das informaes
OpenNLP e os modelos treinados anteriormente para a contidas nessas bases no estruturadas.
primeira verso do NER. O principal desafio foi o fato Portanto, a disponibilizao desses servios pode
de que a portabilidade de cdigo Python para Java nem servir para conferir maior exatido ao trabalho de instru-
sempre possvel em muitas customizaes. Portanto, o de processos, bem como para colocar disposio,
essa iniciativa poderia no ser bem-sucedida caso um para os profissionais de Controle Externo, contextos per-
ou mais frameworks utilizados em Python no existis- tinentes a todo trabalho desenvolvido de forma textual.
sem de forma similar em Java. No obstante, o servio Ao elaborar determinado relatrio, por exemplo,
NER, de acordo com a arquitetura padro de servios toda a jurisprudncia existente sobre o tema desenvolvido
do TCU, Arquitetura de Referncia 8, foi desenvolvido poderia ser automaticamente relacionada ao texto nascente
e encontra-se em produo no ambiente JBoss 6 EAP. de forma a simplificar o processo de busca por informaes
A dcima segunda etapa, ocorrida entre 16 de relevantes ao contedo a ser elaborado. Outro exemplo de
setembro de 2016 e 11 de outubro de 2016, teve como uso seria a elaborao de resumos de textos recebidos de
objetivo a construo de um servio capaz de detectar rgos jurisdicionados de forma automtica, para agilizar o
possveis erros materiais em acrdos proferidos pelo processo de anlise desses documentos externos.
TCU antes de serem oficializados. Foram utilizados cer- Alm disso, podem-se elaborar, por meio de ser-
ca de 600 documentos para o teste da ferramenta dentre vios cognitivos, clippings personalizados a respeito de
cerca de 1 mil acrdos apontados por uma inspeo cada assunto tratado em determinado trabalho. Assim,
realizada pela Corregedoria do TCU como possuidores os auditores tero sempre as informaes mais atua-
de erros materiais em sua elaborao. O resultado alcan- lizadas que subsidiem a elaborao dos relatrios de
ado pelo servio cognitivo foi uma captura de cerca de fiscalizao e todos os demais documentos necessrios.
40% dos erros materiais presentes nos acrdos, aps
a verificao da grafia correta dos nomes dos respons- REFERNCIAS
veis, CPF e CNPJ inexistentes ou pertencentes a pessoas
fsicas j falecidas ou a pessoas jurdicas inativas. NOVELLI, Andreia, OLIVEIRA, Jos. Simple Method for Ontology
A dcima terceira etapa, em andamento desde 18 Automatic Extraction from Documents. International Journal of
de outubro de 2016, tem como objetivo a disponibiliza- Advanced Computer Science and Applications. Vol 5. No. 12. 2012
o de um servio de extrao automtica de ontologias
em formato OWL, de documentos de texto, utilizando MADDI, Govind, VELVADAPU, Chakravarthi. Ontology
algoritmos de machine learning. So utilizados cerca de Extraction from text documents by Singular Value
280 mil documentos de jurisprudncia do TCU. utili- Decomposition. ADMI. 2001
zada a tcnica Latent Semantic Indexing realizando a de-
composio da matriz W de documentos x conceitos, BERRY, Michael, DUMAIS, Susan, OBRIEN, Gavin. Using Linear
obtida pela tcnica Bag of Words e normalizao TF-IDF, Algebra for Intelligent Information Retrieval. SIAM Review.
usando Singular Value Decomposition. Latent Semantic Vol 37. No.4, pp-573-595, December 1995.