Seu Browser esta com problemas de leitura de javascript!

Volume 5 Número 2 - Novembro de 2013
ISSN: 2177-6571

Implantação de pontos com o novo sistema automático de arrecadação para testes – 1a etapa

28/10/2012

Centro de Pesquisas Avançadas Wernher von Braun

Compilação: Mário Abreu

CCR Engelogtec

Resumo

A Concessionária NovaDutra, por solicitação da Agência Nacional de Transportes Terrestres – ANTT, executou uma série de testes e medições para verificar o nível de acerto que equipamentos de Reconhecimento Automático de Caracteres, conhecidos como OCR, teriam em condições reais de tráfego ao longo da rodovia Presidente Dutra. O principal objetivo era fazer uma avaliação inicial da viabilidade de se adotar solução de cobrança de tarifas de pedágio através das placas dos veículos. Além disso, foram avaliadas as produtividades de operadores no tratamento visual das imagens, com o objetivo de identificar as placas colhidas através de fotografias registradas pelos equipamentos. Desta forma seria possível estimar o dimensionamento e custo da equipe necessária no BackOffice.

Para as medições, foram escolhidos cinco pontos para a instalação dos equipamentos, de cinco fornecedores distintos, buscando diferentes comportamentos de tráfego e posicionamento em relação à iluminação natural, bem como avaliar os mecanismos de iluminação artificiais disponibilizados pelos fabricantes.

Após o período de ajustes dos equipamentos, e acompanhamento por alguns dias dos resultados,amostras estatísticas “oficiais” dosdados foram colhidas e analisadas pelo Centro de Pesquisas Avançadas Wernher von Braun, que registrou, documentou todo o processo e emitiu relatório de resultados, que foram entregues à Concessionária NovaDutra e à ANTT.

Palavras-chave: OCR, pedágio, backoffice, estatística.

Abstract

Abstract

NovaDutra Concessionaire, requested by “AgênciaNacional de TransportesTerrestres – ANTT”, developed a testing measuring program to determine the accuracy of Automatic Optical Character Recognition (OCR) equipments. The study was executed under real conditions in the Presidente Dutra Highway. The main objective was to evaluate if OCR equipments could be used to read car plates and, thereafter, be used as a toll system. Also, the OCR data was analyzed visually by operators using the obtained images, to investigate the accuracy of the equipment and the operators productivity. This analysis could help to determine the costs of the necessary team of the BackOffice.

Five equipments provided by five different manufacturers where used at five different points. These points where selected to evaluate different conditions of traffic, daylighting and artificial lighting, also provided by the manufacturers.

Initially, the equipments results were analyzed until consistent results were obtained. After that, statistical data was sampled and analyzed by the Wernher von Braun Advanced Research Center. This paper describes the whole process and shows the results obtained and reported to ANTT.

Key Words:OCR, toll, BackOffice, Statistics

 

1.      Introdução

 

Em vista da crescente necessidade de suporte ao volume de veículos em circulação pela malha rodoviária nacional e, com vistas a melhor atender o usuário dentro de um serviço continuado de alto-padrão, o domínio das técnicas automáticas de identificação e classificação de veículos se torna ferramenta indispensável.

A dinâmica de circulação de veículos nos principais eixos de transporte do país se caracteriza pela complexidade de cenários de densidade e tipos de veículos. Nesse contexto, fica evidente a necessidade de se criar, ao mesmo tempo, condições para aumentar o fluxo combinado com uma maior capacidade de identificação e classificação dos veículos que circulam pelo sistema.Essa necessidade combinada é um desafio técnico e operacional, já que identificação e classificação são em princípio mais difíceis de alcançar quando os veículos estão em movimento, em alta velocidade e nas variadas condições de trânsito nas rodovias.

Um sistema de identificação e classificação de veículos automático operacional nestas condições é uma ferramenta imprescindível para operações de pedágio. A partir do estabelecimento dessas condições, será possível estruturar uma operação de pedágio mais justa, que considera trechos percorridos, tipos de veículo e condições de trânsito.

O projeto teve como objetivo montar, comissionar, integrar dados e gerar estatísticas de índices de acerto provenientes de 5 pórticos localizados na rodovia sobre a responsabilidade da Concessionária NovaDutra. Cada pórtico possui infraestrutura para inspeção de veículos fornecida por empresas diferentes, o que fornece variedade de tecnologias ao projeto, embora, essencialmente, os métodos de leitura e recursos de aquisição ópticos sejam os mesmos. Assim, seria esperado que variações observadas nos resultados reflitam pouco a variedade de tecnologias que participam do projeto e mais as condições extrínsecas ou ambientais. Por exemplo, espera-se que a taxa de imagens absolutamente não conformes(que não podem ser identificadas) oscile mais como função da densidade de veículos sob o sistema de aquisição e não pelo fato de se usar um tipo de câmera ou outro. A taxa de imagens não conforme é um dos resultados que se extraem dos dados mais críticos, uma vez que placas que não podem ser lidas representam uma perda de cobrança no modelo que prevê cobrança de pedágio por leitura de imagem de placa.

Por outro lado, a taxa de imagens conformes para um humano é diretamente relacionada à chance de, em uma passagem, o sistema globalmente resultar em um registro que só pode ser lido por um agente humano. Essa frequência multiplicada pelo fluxo de veículos é de importância fundamental para o dimensionamento do BackOffice ou procedimento de validação de imagens não lidas automaticamente.

 

2.      Sítios de coleta de dados

 

O objetivo fundamental da fase preliminar do projeto foi medir a qualidade do processo de leitura automática de placas de veículos através de um conjunto de 5 portais localizados na rodovia, 4 deles dispostos no sentido Rio de Janeiro - São Paulo (Norte). A localização é como segue:

1.    Km 227 SP (Guarulhos) - GRU;

2.    Km140 (São José dosCampos) - SJS;

3.    Km266(BarraMansa/RJ) - BRM;

4.    Km167(São JoãodoMeriti/RJ) – SJM;

5.    Km 156 (São José dos Campos/SP) - SJC: esse pórtico é no sentido São Paulo – Rio (Sul).

É importante considerar a variedade de número de pistas envolvido no estudo. Por exemplo, 8 pistas (incluindo acostamento) ou apenas 2 pistas e 1 acostamento. Essa condição diversificada de pistas representa uma variabilidade de condições de aquisição, configurações possíveis e fatores extrínsecos de interferência externa.


 

3.      Definições dos índices de eficiência

 

Uma “nota” é um número que representará o status de saída ou resultado de inspeção para uma determinada base de dados de entrada. Uma imagem deve conter informação suficiente para se extrair um código. Portanto os elementos fundamentais da análise são:

·      Registro: conteúdo de informação que identifica uma passagem associada a uma imagem;

·      Imagem: conteúdo de informação que pode conter uma placa;

·      Placa: pedaço da imagem que pode conter informação sobre um código;

·      Código: sequência de caracteres que pode representar umcódigo válido;

·      Código válido: pedaço de informação que pode conter um código validado (placa correta) do veículo capturado na imagem;

·      Código validado: informação que contém o código existente e correspondente ao do veículo responsável pelo registro.

O fluxo de informação da placa até o resultado final desejado é RegistroèImagemèPlacaèCódigoèCódigo válidoèCódigo validado. A chance de se obter uma leitura correta de um veículo registrado no momento da passagem é o produto das probabilidades:

·      Probabilidade de se capturar um veículo: essa probabilidade depende de fatores sistêmicos como, por exemplo, eficiência de disparo da câmera no momento da passagem do veículo;

·      Probabilidade de se capturar uma placa: dado que uma imagem foi adquirida contendo um veículo, ela deve conter uma placa. Essa probabilidade depende de um grande número de fatores extrínsecos e intrínsecos ao sistema: qualidade da placa, ângulo de posição do par câmera-veículo, iluminação externa, presença de sobras, ângulo de posição do sol etc;

·      Probabilidade de se ter um código válido: uma vez capturada uma imagem contendo uma placa, uma fração da imagem será lida com o algoritmo OCR e resultará em um código que pode ser válido. Por código válido entende-se uma sequência de 3 caracteres de letras e 4 caracteres de números. Essa probabilidade depende da qualidade da imagem e daeficiência de detecção da placa na imagem pelo software;

·      Probabilidade de se ter uma leitura validada: depende de fatores de BackOffice (habilidade do inspetor) de validar a imagem, ângulo deposicionamento, iluminação e tipos de caracteres presentes na placa.

A chance de se ter uma leitura correta (validada) será o produto das probabilidades descritas acima. Não é difícil ver que, se um código válido existe no registro, então, muito provavelmente, uma placa legível por um humano será encontrada na imagem.

A eficiência de leitura pode ser avaliada diretamente a partir da inspeção realizada por humanos sobre as placas. Por exemplo, ao se examinar por meio de um agente humano, um grupo de n imagens (amostra) contendo, cada uma, placas únicas de veículos escolhidos em determinada hora de um determinado dia, o índice de acerto para o humano (ou nota de imagens conformes para o humano) pode ser definido como:

%ICH = número de imagens legíveis apenas pelos humanos/Número total de imagens ilegíveis para software OCR.

Esse é o número de imagens incorretamente interpretadas pelo software OCR, mas que, para um operador humano bem treinado, resultam na leitura correta dos caracteres. Da mesma forma, podemos definir:

%ICE: nota de imagens legíveis pelo software OCR. Trata-se da frequência de acertos do software (ou de conjunto de softwares) e envolve, necessariamente, a análise por BackOffice via operadores humanos. Podemos também definir essa nota por: %ICE = número de imagens corretamente lidas pelo software OCR/N;

%INCE: nota de imagens não lidas pelos softwares de OCR. Trata-se de %ICE descontado de 100%, ou seja, é o resíduo das leituras conformes o software OCR;

%INC: nota de imagens absolutamente ilegíveis. É o resíduo das imagens ilegíveis pelos humanos (%ICH).

O diagrama pode ser ilustrado como na figura 1:

Figura 1: Diagrama de uma das alternativas para análise de um conjunto de n imagens para apresentação do problema. Abaixo do nível das imagens ilegíveis, há outras separações.

 

Como a eficiência de leitura de um humano é superior ao de softwares OCR, %INC é o percentual esperado de imagens ilegíveis. As causas de perda de reconhecimento são:

·      Imagens com pouca iluminação (por motivos vários, chuva, neve etc);

·      Presençadecaracteresproblemáticos;

·      Placasavariadasirreconhecíveis;

·      Ocultamento de veículos (efeito de sombra causado por veículos altos e densidade elevada de tráfego);

·      Falhas técnicas de disparo de imagem (causas ligadas ao sistema de captura).

Esses fatores têm impacto direto na probabilidade de se ter um código válido, uma vez capturada uma imagem contendo uma placa. As características acima descritas podem ser inferidas a partir do conjunto de imagens. Portanto, o %INC pode ser subdividido em diversos outros índices menores. Em particular, o fatores 2 e 3 são os mais importantes pois:

• O fator “placas avariadas irreconhecíveis” determinam diretrizes para substituição de placas;

• Caracteres (letras) graficamente parecidos, o que causam erros de reconhecimento tanto pelo sistema automático como pelos humanos.

Em menor grau, o fator “ocultamento devido ao excesso de veículos” representa uma perda dependente do nível de densidade de veículos (veículos/km), portanto, seessa taxa de inconformidade fora do valor tolerável, pórticos de registro de placas para fins de pedágio devem se localizar em regiões livres de congestionamento (ou regiões onde congestionamento sejam menos frequentes). Tais questões devem ser respondidas dentro do escopo do projeto.

A Figura 2 representa um diagrama esquemático de um relacionamentos entre as notas que éconcebível para um conjunto de imagens. Não é difícil ver que são válidas as relações:

%ICE + %INCE = 1; e %ICH + %INC = 1.

Relações desse tipo podem ser obtidas para vários outros índices. É importante considerar que essas notas são sazonais, isto é, elas dependem do tempo. Isso acontece principalmente por causa de variações na densidade de veículos e variações no nível de iluminação externa. Por causa dessa dependência, é razoável montar o processo de amostragem de dados por período. Não é necessário definir um “mínimo período”, mas amostrar sobre um período em que se observem a ocorrência de condições externas homogêneas, ou seja, o processo deve ser feito sobre fatias homogêneas de dados.

 

4.      Processo de inspeção de imagens em BackOffice

 

De uma forma bem sintética, a metodologia utilizada se baseou na coleta dos dados dos equipamentos instalados, que foram consolidados em uma base de dados para posterior tratamento. Os dados foram trabalhados e disponibilizados para a análise de backoffice, no intuito de avaliar o nível de acertos e erros dos equipamentos, através de inspetores que utilizaram um software especificamente desenvolvido para isso. Uma segunda equipe fez uma revalidação dos dados, a fim de verificar o nível de acertos e erros dos inspetores. A Figura 2 demonstra simplificadamente o processo.

 

Figura 2: Diagrama descritivo do processo de análise em backoffice.

 

Após os tratamentos e análises estatísticas executadas pelo Centro de Pesquisas Avançadas WernhervonBraun, foram estabelecidos índices para demonstrar os resultados obtidos, seguindo o esquema demonstrado na figura 3. São eles:

·      %fCE: percentual de imagens lidas pelo software corretamente;

·      %fCH: percentual de imagens com códigos válidos que só humanos leem;

·      %fPI: percentual de placas ilegíveis (humanos e automático);

·      %fPP: percentual de imagens inválidas (placas perdidas);         

·      %fPAL: percentual que o sistema diz que lê do total que ele retornou válido;

·      %fIL: percentual que o sistema diz que lê do total de imagens.

 

Figura 3:Hierarquia binomial usada no método de inspeçãoe validação das imagens.

 

5.      Síntese do trabalho executado

 

Um sistema de teste foi instalado numa sequência de sítios ao longo da Via Dutra para a determinação do nível de acerto de inspeção automática via OCR para todos os períodos ao longo de um conjunto de dias de operação. A taxa efetiva de acerto (considerada correção de perda de tráfego e apoio de BackOffice, ou seja, é a soma %fCE+%fCH), e para os melhores pontos flutua dentro do intervalo 70%-80%. Esse índice de validação de leituras foi obtido em apenas dois sítios, o de Guarulhos (km 227) e o de São José dos Campos ‘sul’ (km 140). O primeiro sítio adquiriu imagens da fronteira de veículos, enquanto que o segundo capturou imagens traseiras. O site GRU é responsável por 44% do fluxo de veículos no trecho de rodovia estudado, enquanto que o ponto SJS é responsável apenas por 12% do fluxo total. Para atingir o nível de certeza nos resultados, o projeto desenvolveu um processo de auditoria interna que levou em consideração a contagem de tráfego por meio de sistema independente (conhecidos como ATs – Analisadores de Tráfego). Considerando os dias “oficiais” de aquisição, as taxas máximas de acerto corrigido para cada sítio se distribuem conforme segue:

·      GRU: 71,5% (17/9/2012) e 72,7% (18/9/2012);

·      SJS: 69,4% (17/9/2012) e 77,4% (18/9/2012);

·      BMA: 22,0% (17/9/2012) e 23,0% (18/9/2012);

·      SJM: 42,5% (17/9/2012) e 42,7% (18/9/2012);

·      SJC: 26,4% (17/9/2012) e 24,7% (18/9/2012).

O projeto envolveu a integração de dados em diversos segmentos ou estratos tais como: sítio de aquisição, período do dia, tipo de dado dentre outros. Um processo especial de inspeção precedido por auditoria na estrutura de dados foi estabelecido. Durante o conjunto de dados considerados “oficiais”, todos os fornecedores operaram seus sistemas de forma simultânea para possibilitar integralização de dados. O processo de inspeção final envolveu a utilização de 10 a 20 pessoas formando um comitê de inspetores (BackOffice) para agrupamento dos dados da leitura e detecção em várias classes: grupo de acerto do sistema automático, grupo de acerto exclusivo dos humanos, grupo de dados contendo placas ilegíveis, grupo de dados com placas inválidas e grupo de motocicletas. Cada um desses grupos foi usado para compilar índices ou frações de acerto específicas para cada estrato junto com seus desvios-padrão. O projeto demonstrou que existem variações no tempo de inspeção médio entre inspetores e que os pontos que apresentam melhor desempenho (essencialmente medido pela fração de imagens validadas do total de registros) também coincidem com os pontos de maior velocidade de análise emBackOffice. Assim, quanto melhor for o desempenho do ponto de aquisição tanto menor é o esforço humano dispendido na análise das imagens. Isso acontece porque sistemas com índices de acerto automático piores requerem mais tempo de digitação de código correto e não apenas a mera checagem visual de imagens. Tempos típicos de análise em regime de alta eficiência estão no intervalo 2-4 segundos enquanto pontos que exigem digitação das placas fazem 8-12 segundos. O tempo médio de inspeção inferido a partir do “estado da arte” instalado durante o projeto é de 4 segundos.

Para as taxas de acerto automático, sem considerar as perdas envolvidas, para os melhores níveis alcançados (melhores sítios) não se observam variações grandes entre dia e noite, nem aparentemente com o tipo de placa (cor, reflexividade). Com consideração de análise de tráfego, foram observadas perdas consideráveis de registro nos dias 17/9 e 18/9 para os sítios BMA e SJC (índices de relação registro-tráfego superiores a 60%). Para esses pontos, as notas de inspeção automática foram corrigidas para o fluxo registrado e resultaram em valores típicos entre 20%-30%, bem inferiores aos registros de GRU e SJS. O sítio de SJM, embora tenha apresentado o menor índice de perda de veículos, apresentou o menor nível de acerto de todos os sítios. De forma geral, as perdas por ilegibilidade de placa ou imagens não conforme somam aproximadamente entre 10%-20% do fluxo efetivamente registrado para os sítios com as melhores notas de inspeção, enquanto que o resíduo das diferenças para o total deve necessariamente ser inspecionado por operadores humanos. A percentagem de imagens do total que deve necessariamente ser inspecionado por humanos envolve considerações financeiras e pode ser estimado parcialmente pela análise dos índices. Porém, com base nos tempo médio determinado para inspeção de um registro pelo BackOffice usado no projeto, foi estimado o número de pessoas necessárias para inspecionar todos os registros gerados por todos os pontos, assumindo que não há perdas de tráfego (registro). Para o tempo médio de inspeção (4s), 48 pessoas são necessárias trabalhando em um turno de 8h, enquanto que se o tempo de 10s de digitação média for usado (o operador não faz a checagem do código gerado, mas digita diretamente a placa) esse mesmo número é da ordem de 120 pessoas. Variações de duração de turno podem ser importantes para garantir boa eficiência de inspeção pelos os humanos. Os erros de leitura automática observados (ou, equivalentemente, frações de imagens exclusivamente lidas por humanos) estão muito relacionados à presença de caracteres específicos que causam maior erro. Tais caracteres podem ser usados para segregar placas em BackOffice, aumentando a eficiência final de inspeção. Ainda na questão “detecção de veículos”, ficou claro que o uso de laços virtuais – em que pese a vantagem expressiva de não se ter que instalar nenhum dispositivo na pista – sofre de algumas desvantagens, como a necessidade de regime de iluminação constante.

Com relação à incidência de chuvas, boa parte do projeto transcorreu durante o período de estiagem, portanto, uma análise sistemática da influência de chuvas não foi realizada. Entretanto, no dia 21/9/2012 foi possível extrair as frações de desempenho para um período de chuva moderada para GRU, o que foi observado por meio da impressão da imagem (perda de contraste). Os resultados não permitem inferir que houve perda de qualidade no processo de inspeção, utilizando dados de um dos melhores pontos de aquisição, embora tenha ocorrido um aumento pequeno da taxa de imagens ilegíveis. Com relação à eficiência de inspeção de motocicletas, um dos sítios capturou imagens traseiras, e valores típicos da ordem de 25% foram encontrados. Aproximadamente 50% dosregistros de motos somente pode ser inspecionada por operadores humanos.

No que se refere à possibilidade de se usar o sistema para rastreamento sucessivo de veículos, ou, de forma equivalente, as taxas de leitura automática sucessivas, a utilização das melhores frações de validação de código e sob a assunção de perda nula de tráfego levam a valores teóricos da ordem de 81,9%±9,0% para 2 pórticos, 72,9%±12,1% para 3 pórticos e 65,6%±14,5% para uma sequência de 4 pórticos. Durante o projeto não foi possível executar um teste de rastreabilidade, o que não impediu a determinação dos coeficientes de rastreamento, que podem ser obtidos a partir dessas taxas de leitura individuais.

 

6.      Principais resultados obtidos

 

Após todas as validações e tratamento estatístico da amostra “oficial” dos dados coletados, apresentamos a seguir na Figura 4 os principais indicadores aferidos.O índice principal de acerto médio, corrigido para o fluxo –chamado de %cfCE para todos os sítios é a taxa de acerto considerando toda perda de tráfego.

 

Figura 4: Tabelas contendo as notas médias para os diversos sítios nos dias indicados. Destacamos os índices %Irv (perda de fluxo) e a fração corrigida média de acerto que, no final, o percentual total de veículos efetivamente lidos e validados por cada um dos sistemas.

 

8.      Considerações Finais

 

O método implementado para inspeção em BackOffice demonstrou sucesso na inspeção para geração de estatísticas das diversas notas pré-definidas. Em particular, foi visto que os índices %fPAL e %fIL (percentual de placas assertivamente válidas e percentual de registros que retornam código válido respectivamente), embora representando um nível de acesso à qualidade final do sistema de leitura OCR, não são indicadores globalmente válidos. Em seu lugar, deve-se considerar o uso de %fCE, %fII e %fCH em conjunto com %IrV como índices de caracterização apropriados do sistema.

Emparticular,oresultadofinaldasnotastevequesercorrigidoparaosfluxos aferidos no momento de passagem por um sistema independente da contagem de tráfego. Por meio da criação de um índice adicional, %IrV, foi possível conhecer o valor real de cada nota. É importante considerar que as perdas totais são obtidas da soma de diversos termos. Para cada sítio j e período k, a perda total será dada por %fPI(j,k)+%fPP(j,k)+%IrV(j,k). Idealmente, %IrV(j,k)è0 com os sistemas mais bem ajustados, de forma que a perda total é equivalente a %fII(j,k) = %fPI(j,k)+%fPP(j,k). Os sistemas instalados em rodovia, ainda que tenham uma chance não nula de perder veículos, devem necessariamente registrar essa perda em sistema. Durante o projeto, foi exigido que os fornecedores produzissem, em tempo real, relatórios de log de sistema, contendo instruções ou descrições internas de cada sistema de câmera sobre seu status de funcionamento, paradas, eventuais perdas de comunicação etc. ApenasosítioGRU produziu relatórios de log suficientemente completos que registram também perdas sistêmicas de captura. Assim, ainda que se observem perdas pela análise de %IrV, o sistema reportou estar ciente disso. Esses relatórios são importantes e suplementares para a caracterização da solução utilizada e todos os registros produzidos em um determinado ponto de inspeção, já que representam a “vida real” e não o que fornecedores em geral idealizam com relação a seus sistemas.

Espera-se internamente que o número de registros seja igual ao número de imagens. Entretanto, problemas internos podem fazer com que o número de imagens seja menor (por conta de perdas ou dificuldades de gravação da imagem), o que é esperado. Entretanto, o número de imagens não pode ser maior. Em alguns pontos (SJM e SJC) foi observado que imagens foram geradas em excesso ao número de registros. Isso se constitui um problema grave já que a inspeção em BackOffice despreza, por inexistência de referência de registro, as imagens em excesso. Porém, em SJM foi constatado que %IrV tornou-se negativo em alguns períodos, por conta de geração de registros em excesso ao número real de veículos. Se esses registros estão associados a imagens, isso pode gerar trabalho adicional em BackOffice. É importante considerar que o uso de registros e imagens múltiplas pode ser uma estratégia de inspeção – aumento de redundância – mas está associado a trabalho adicional de inspeção.

As notas ou índices observados ao longo de vários períodos em dois dias escolhidos de funcionamento comum de todos os sítios demonstram uma variedade inter sítios e uma variação intra sítios. A variação inter sítios foi maior que a esperada originalmente. Com relação à variação intra sítios, as curvas para GRU e SJS são razoavelmente homogêneas em um longo período do dia apresentando quedas nos períodos noturnos. Essas quedas estão correlacionadas com acréscimo do percentual %fCH, indicando requisição de BackOffice na inspeção de imagens não conformes. Isso é esperado segundo o estado da arte da tecnologia de OCR. Assim, a curva de desempenho de sistemas OCR apresenta máximos nos períodos de maior luminosidade (meio do dia) e mínimos no período noturno. Tal observação é importante para o planejamento do BackOffice já que esse comitê será menos requisitado nos períodos de maior luminosidade (taxa maior de registros válidos).

O comportamento dos sistemas GRU e SJS convergidos apenas demonstram correlação com a luminosidade. Não se constatou qualquer correlação das curvas com a densidade de tráfego. Se tais períodos são inspecionados, observamos que não houve modificação alguma nas notas de desempenho. Isso indica que, para o nível de congestionamento da ordem de 50 a 60 veículos por km, o sistema de inspeção instalado em GRU é robusto e apenas dependente do nível de iluminação como esperado.

Ainda com relação às perdas intrínsecas de registro, notamos que as perdas maiores ocorreram em sistemas que não utilizam processos ativos de detecção. Um processo ativo de detecção faz uso de instrumental de pista que é acionado com a passagem fisicamente próxima do veículo. Sistemas passivos ou ‘virtuais’ tais como os chamados ‘laços virtuais’ dependem de variações consideráveis de iluminação externa para que sejam efetivos. Embora acreditemos que esses sistemas são, de fato, eficientes, eles exigem condições mais rigorosas para seu funcionamento pleno. Dentre elas, a mais importante é garantir um nível mínimo de iluminação externo que seja comensurável com a sensibilidade das câmeras que dele fazem parte. Isso significa que, em tais sistemas, iluminação externa é necessária, o que parece indicar que o uso de laços virtuais é propício a ambientes urbanos onde iluminação pública já está disponível. Em ambientes rurais, postes com iluminação adicional devem ser utilizados. Embora não seja escopo do projeto, é provável que iluminação infravermelha seja suficiente para a função de contraste. De qualquer forma, laços virtuais, se por um lado apresentam a vantagem de não exigir intervenções na pista, tem a desvantagem de exigir iluminação. É provável, além disso, que mesmo com iluminação adicional, certas cores de veículos influenciem na taxa global de aquisição, o que deve ser confirmado por testes adicionais;

Por outro lado, as curvas de %fCE observadas nos sítios de BMA, SJM e SJC são diferentes das curvas equivalentes para GRU e SJS, o que caracteriza a variação inter sítios. Isso indica que os sistemas de BMA, SJM e SJC não estão ajustados o suficiente para a tarefa de registro e inspeção de imagens. Além disso, as notas finais para esses sítios – corrigidas segundo %IrV – resultaram muito baixas por conta da perda de veículos. Em particular, o sítio de SJM, embora apresente o melhor desempenho de todos no registro de veículos, está com as notas de desempenho em OCR inerentemente baixas, apresentando períodos de geração espúria de registros conforme comentado anteriormente. As curvas de desempenho %fCE em SJC estão abaixo e coincidentes com a curva %fPAL. Isso acontece porque em SJC apenas os registros que resultaram em códigos válidos estão sendo reportados (o mesmo ocorre em BMA). Pela definição de %fPAL e %fCE, se o número de imagens com registros válidos (m) for igual ao número total de registros (n), as duas notas coincidem.

Com relação à estatística de motos (índice %fT), foi necessário segregar as imagens que correspondem a esse tipo de veículo. Essa foi, na verdade, o único tipo de classificação veicular que foi feito. Os sítios de GRU e SJS foram os únicos que registraram presença de motos (há uma pequena contribuição residual em SJM em 18/9 que é provavelmente espúria) e a estatística de presença indica taxas médias da ordem de 4,18%±0,33% e 3,68%±0,31% em 17/9 e 18/9, respectivamente, em GRU e 3,38%±0,45% e 2,19%±0,33% em 17/9 e 18/9, respectivamente, em SJS. Portanto, a quantidade de motos parece estar limitada a menos de 5% do fluxo total. Ainda assim, o sistema instalado em SJS (que capturava placas traseiras de veículos) conseguiu detectar e retornar códigos validados para aproximadamente 1⁄4 do volume de motos. A inspeção humana torna-se especialmente necessária na maioria dos casos (cerca de 54,7%) e aproximadamente 29% do volume é perdido.

Não foi detectada variação apreciável dos índices de inspeção com a incidência de chuva com base em dados de GRU. O período escolhido (5:00) corresponde a um período de baixa iluminação e tráfego pequeno que antecede a um período de congestionamento.

Com relação ao planejamento do BackOffice em uma operação real do sistema, a análise dos tempos de inspeção (propiciado pela medida desses tempos por meio de uma interface especial criada durante o projeto) determinou um tempo médio de 4s. Não obstante esse valor, é importante considerar que o tempo real de inspeção por registro dependerá bastante da maneira como serão organizados os dados e sua distribuição entre diversos inspetores. Há várias estratégias de inspeção, sendo que a frequência com que se inspeciona uma imagem depende de seu status no sistema (se ela apresenta um código válido é apenas uma dessas caracterizações). O fato de o código válido apresentar certa sequência de letras ou o registro ter sido obtido em determinadas horas propícias ou não do dia são outras caracterizações possíveis. Portanto, o tempo efetivo de inspeção dependerá bastante desses arranjos especiais, e aqui apenas determinamos medidas aproximadas de esforço de BackOffice conforme o tempo médio ou o tempo médio de digitação (aproximadamente 10 s), na hipótese de todos os registros serem inspecionados. Em particular, nesse último caso, um turno de 6 horas de inspeção determina um máximo de aproximadamente 2200 registros/dia por inspetor, enquanto que valores progressivamente maiores são obtidos com turnos mais longos. Chamamos a atenção que essa ‘duração de turno’ é o tempo líquido ou efetivo de inspeção. Assim, um turno de 6h pode corresponder a um turno oficial de maior período, conforme a política adotada de descanso ou horários livres (almoço, intervalos de lanche, descanso etc). Considerado esse intervalo de 6h, um número máximo de 160 pessoas seria necessário para inspecionar todo o fluxo diário pelos 5 sítios que fizeram parte do projeto, onde consideramos os sistemas ajustados e sem perda em relação ao tráfego real. Essa análise deve ser refeita ao se considerar a necessidade de inspeção de imagens da pista sentido ‘norte’ num total de 8 sítios e um fluxo aproximadamente dobrado (a menos de SJC, o fluxo em um sentido deve considerar apenas os volumes aferidos em GRU, SJS, BMA e SJM).

 

2.      Principais Conclusões

 

1.    Considerando perdas de tráfego, taxas da ordem 60%-70% foram obtidas de acerto do sistema de inspeção automática de placas;

2.    A taxa de acerto global do sistema pode ser melhorada com apoio de BackOffice;

3.    Perdas estimadas de imagem (placas perdidas ou ilegíveis) estão entre 10% e 20% (podem não ser perdas intrínsecas, mas de conservação das placas);

4.    A taxa de acertos não indica necessariamente garantia de localização do proprietário do veículo (avaliação da situação das placas coletadas na amostra);

5.    Efeito maior sobre as notas do nível externo de iluminação. Efeito de posicionamento das placas pouco relevante. Efeito de chuva fraca e moderada pouco influente (mas seria necessário maiores estudos fora do período de estiagem), efeito de congestionamento não tangível pelo estudo;

6.    Fluxo de motos <5%, com eficiência automática de leitura de placa traseira da ordem de 25%. Cerca da metade das fotos são lidas apenas por humanos e o resto perdido;

7.    Planejamento de BackOffice: 160 pessoas/turno/dia para inspeção de todo fluxo num regime de turno de 6 horas. Estratégias de distribuição de imagens brutas tem impacto grande no tempo total de inspeção (estimado 4 s em média, típico 10 s para digitação do código RENAVAM).

 

Referências

 

Centro de Pesquisas Avançadas WernhervonBraun. Relatório de projeto “Sistema Automático de Arrecadação: Estatística de Leitura de Placas”. Campinas, 2012.

A Revista

A Revista ANTT é uma publicação eletrônica técnico-científica de periodicidade semestral, criada com a finalidade de divulgar o conhecimento na área de Transportes Terrestres para o público em geral, provocando o intercâmbio de informações. O público-alvo é composto por servidores, colaboradores, meio acadêmico, setor regulado, outros órgãos públicos e profissionais da área.

Entrevistados

  • Edição da Revista:
    Volume 3 Número 2
    Novembro de 2011
  • Josias Sampaio Cavalcante Júnior
    Diretor-Presidente da VALEC
    Edição da Revista:
    Volume 5 Número 1
    Julho de 2013
  • Mário David Esteves Alves
    REFER TELECOM
    Edição da Revista:
    Volume 4 Número 1
    Maio de 2012
  • Luiz Pinguelli Rosa
    Presidente do Fórum Brasileiro de Mudanças Climáticas
    Edição da Revista:
    Volume 4 Número 2
    Novembro de 2012
  • Luís Henrique Baldez
    Presidente Executivo da ANUT
    Edição da Revista:
    Volume 3 Número 2
    Novembro de 2011
  • Marcelo Perrupato
    Secretário Nacional de Políticas de Transportes
    Edição da Revista:
    Volume 3 Número 1
    Maio de 2011
  • Paulo Sérgio Oliveira Passos
    Ministro dos Transportes
    Edição da Revista:
    Volume 2 Número 2
    Novembro de 2010
  • José Roberto Correia Serra
    Diretor presidente da CODESP
    Edição da Revista:
    Volume 2 Número 1
    Maio de 2010
  • Bernardo José Figueiredo Gonçalves de Oliveira
    Diretor Geral da Agência Nacional de Transportes Terrestes - ANTT
    Edição da Revista:
    Volume 1 Número 1
    Novembro de 2009
Copyright © 2012
ANTT - Agência Nacional de Transportes Terrestres - Revista ANTT
ANTT - Agência Nacional de Transportes Terrestres

TOPO