As empresas e a web semântica

BBC, Novartis, Pfizer, Vueling, Best Buy, Merck, Bankinter, Renault. As empresas que primeiro chamaram a atenção para o poder da web 3.0 estão demonstrando que a tecnologia semântica não é só uma promessa, como revela esta reportagem. 

web semantica

Uma imensidão de organizações de todos os setores está integrando padrões semânticos a seus sistemas de informação para estruturar e gerir o conhecimento disperso, criar aplicativos online com mais rapidez, colaborar de novas maneiras com outras organizações, tomar melhores decisões, reduzir custos de infraestrutura de tecnologia da informação (TI) e impulsionar o desenvolvimento e a venda de novos produtos e serviços. Mesmo que o entusiasmo quanto à web 3.0 ainda gire em torno do potencial dos serviços para consumidores –redes sociais, bancos de dados e buscadores inteligentes que interpretam os pedidos do usuário–, aos poucos a atenção começará a se voltar para as inovações do setor corporativo.

As grandes multinacionais que dependem do uso intensivo do conhecimento, como indústrias farmacêuticas e petrolíferas, orgulham-se de ter as melhores práticas. São empresas que destinam muito tempo à pesquisa e ao planejamento e, por isso, exigem sistemas flexíveis, interfuncionais, que lhes permitam articular funcionários em locais diversos e fontes de dados heterogêneas em projetos comuns e fáceis de operar.

A web 3.0 vive sua infância, mas há indícios que prognosticam uma revolução. Nos próximos cinco anos, a maneira como as empresas publicam, têm acesso e gerenciam o conhecimento terá mudado para sempre.

Titãs da informação

Quando uma indústria farmacêutica decide desenvolver uma nova droga, tem diante de si um projeto imenso, que pode durar décadas e custar milhões. Os cientistas devem navegar por vasta quantidade de documentação, experiências, resultados de testes passados, pesquisas genéticas, informações de saúde pública e regulamentações, tudo armazenado em bases de dados díspares, às quais o acesso é feito por aplicativos diferentes.

logo pfizerMas as funcionalidades semânticas trouxeram uma nova perspectiva para empresas como Merck, Novartis e Pfizer, que hoje aplicam essas tecnologias a seus sistemas de pesquisa para integrar uma infinidade de fontes de modo dinâmico e descobrir novas conexões entre os dados. Seus cientistas estão relacionando ideias e conceitos cuja correlação não teriam detectado no passado.

Vijay Bulusu, diretor de integração de negócios, desenvolvimento e informática médica da área de pesquisa e desenvolvimento da Pfizer, expôs em um evento do setor no final de 2010 seu enfoque a respeito da web semântica.

Em 2008, a empresa tinha estabelecido a necessidade de recuperar e reutilizar o conhecimento corporativo –décadas de pesquisas e projetos armazenados em diferentes formatos e suportes tecnológicos– para acelerar o lançamento de novas drogas.

“Há algum sistema que consiga listar, por exemplo, todas as fórmulas que utilizaram determinado excipiente e que mostre quão estável o medicamento tem sido ao longo do tempo?”, perguntava-se Bulusu. “Existe uma forma de integrar os sistemas que gerenciam dados brutos com os aplicativos que analisam os compostos das drogas?” Tradicionalmente, a resposta teria sido implementar uma solução de data warehousing.

Esses sistemas de armazenamento, porém, apresentam grande restrição: como os dados e as regras para sua exploração são definidos, não podem ser reestruturados de outras maneiras, nem usados por aplicativos além dos quais foram programados. Seus dicionários são incompreensíveis para computadores que não operam nos mesmos padrões. Já em um modelo semântico não é necessário estabelecer esquemas sobre a organização da informação ou predefinir os aplicativos que vão explorá-los.

As bases podem ser fundidas com outras fontes à medida que as oportunidades surgem. “É um mundo muito diferente do das bases de dados relacionais. A flexibilidade das tecnologias semânticas é provavelmente a maior vantagem dessas arquiteturas”, afirmou Bulusu. Atualmente, o laboratório usa o software de base de dados AllegroGraph RDFStore, da Franz, e aplicativos da IO Informatics, ambos específicos da web semântica.

Combinações acessíveis

A interfuncionalidade sempre foi um ponto sensível na integração de projetos corporativos, quase sempre exasperantes devido ao esforço que exigem de tecnólogos e analistas de negócios. Para os primeiros, porque devem consolidar plataformas e aplicativos diversos como bases de dados, folhas de cálculo, e-mail, processadores de texto ou ferramentas de análises e modelagem. Para os segundos, porque têm de verificar a validade dos dados manipulados por silo tecnológico e unificar conceitualmente entidades equivalentes, como os diversos registros que a empresa possa ter de um mesmo cliente segundo a área funcional ou o aplicativo em uso. Conseguir uma única versão da verdade se tornou o Santo Graal dos departamentos de TI.

Ao lado das soluções de armazenamento de dados, ou data warehousing, as arquiteturas orientadas a serviços sobre as quais os aplicativos atuais de inteligência de negócios (BI, na sigla em inglês) funcionam até agora foram as protagonistas absolutas no reino da análise de dados. Entretanto, o surgimento dos padrões da web semântica –as linguagens RDF (Resource Description Framework), WOL (Web Ontology Language) e SPARQL (Protocol and RDF Query Language)– está abalando o setor. Segundo os especialistas, não há tecnologia de gestão do conhecimento comparável em termos de flexibilidade e potencial.

Os formatos semânticos permitem vincular todo tipo de elementos (dados, metadados, mapas conceituais ou ontologias, componentes, serviços, dispositivos, aplicativos) e descrevê-los conceitual e contextualmente para consulta posterior por sistemas inteligentes, capazes de relacionar essas entidades de maneiras como nunca tinham sido vinculadas e descobrir, assim, novas conexões entre os dados.

Experiências bem-sucedidas

De acordo com o último Semantic Web Awareness Barometer, sondagem sobre a consciência em relação à web semântica realizada em 2009 e com 532 empresas de 22 países, 80% das companhias consultadas acreditam que a nova geração da web mudará sua cultura de trabalho e mais da metade garante estar experimentando tecnologias semânticas desde 2008 (a pesquisa é feita pelo Corporate Semantic Web Working Group, da Universidade Livre de Berlim, Alemanha; pelo centro de gestão do conhecimento Know Center, de Graz, Áustria, e pela firma de consultoria Semantic Web Company, de Viena).

Por que essas empresas se interessam? Pelo rápido acesso à informação, pela simplificação dos processos de busca, pela significativa melhoria nos resultados e pelo aperfeiçoamento das habilidades dos trabalhadores do conhecimento –segundo elas. Para Jaime Meléndez, analista sênior de sistemas da área de inovação da Merck, que utiliza a tecnologia semântica para pesquisa e desenvolvimento de novas drogas, a chave do sucesso desses padrões está no fato de serem abertos.

logo pfizerComo não estão ligados a determinado provedor, os tempos e custos de implementar novas soluções não impedem a experimentação. Dezenas de empresas estão ensaiando novos projetos. Em sua sede central na Basileia, Suíça, a Novartis pôs em marcha um “motor conceitual transnacional” que permite fazer buscas inteligentes em diferentes fontes privadas e públicas. A CIA está conectando suas bases de dados em diversos países com “nós semânticos” que estruturam as informações de seus agentes e lhes permitem descobrir relações entre pessoas, lugares e incidentes para identificar a tempo potenciais ameaças terroristas.

O Bankinter, quinto maior banco da Espanha, reconhecido como um dos mais inovadores, desenhou um sistema de recursos humanos baseado em tecnologias semânticas para administrar de modo mais eficiente as propostas de melhoria que seus mais de 4 mil funcionários apresentam regularmente. O sistema é capaz de avaliar sozinho a originalidade e a viabilidade financeira de projetos de redução de custos, novos produtos e serviços ou reformas de processos e ajudar os usuários a precisar suas ideias pela comparação com conceitos similares apresentados por outros colegas. Outra empresa ibérica, a companhia aérea de baixo custo Vueling, avalia a implementação de um produto do fornecedor basco de tecnologia semântica Anboto, premiado no final de 2010 como uma das 100 start-ups mais inovadoras do mundo pela empresa de análise de empreendimentos Guidewire Group.

A Anboto inventou um assistente online inteligente que lida com 600 mil conceitos e “conversa” com os clientes como um ser humano. A Vueling planeja usá-lo como agente de viagens virtual. Em 2010, a Best Buy implantou como projeto-piloto em algumas de suas lojas o software livre GoodRelations Ontology, um vocabulário específico de comércio eletrônico para definir de maneira ampla categorias de bens e preços.

Diferentemente das plataformas convencionais, que esgotam as opções de poucos tipos predefinidos de produtos, o GoodRelations se apoia nos mapas ontológicos para dar plasticidade às descrições.

A Best Buy se saiu tão bem que decidiu aplicar o sistema em mais de mil pontos de venda. Segundo Jay Myers, líder de desenvolvimento de internet da rede varejista, a plataforma melhorou a visibilidade de certos atributos de seus produtos que não eram levados em conta por outros buscadores, o que resultou em aumento do tráfego no site de 30%. Uma iniciativa ambiciosa no terreno do comércio eletrônico business-to-business é o projeto de origem polonesa Momoway Business Searcher, um buscador semântico de produtos e serviços que reúne dados de milhares de empresas de todo o planeta, além de informações sobre feiras e exposições.

De modo semelhante ao GoodRelations, o Momoway permite às empresas rotular semanticamente seus produtos com as palavras que os descrevem melhor. Essas descrições são vinculadas a um dicionário multilíngue que verte os conceitos de um idioma para outro e habilita a interação entre empresas de diferentes países de maneira simples e dinâmica. Financiado em 70% pela União Europeia até abril de 2012, o Momoway funciona desde dezembro de 2010 como um serviço beta na internet.

Depois de sua experiência na web semântica durante a Copa da África do Sul –evento para o qual a BBC desenvolveu o site BigOWLIM, um domínio de ontologias ou mapas conceituais sobre a Copa do Mundo–, John O’Donovan, chefe de jornalismo e conhecimento da BBC Future Media & Technology, disse que o conglomerado mudou sua visão sobre os meios na internet. “Acho que fomos precursores em usar o conceito semântico para subir conteúdo à web maciçamente. Não publicamos mais histórias, mas dados como ativos que se organizam em ontologias, e estas, em histórias ou páginas a pedido do usuário”, explicou O’Donovan. “Não há dúvida de que a web semântica revolucionará a indústria editorial.”

O setor tecnológico se prepara

Um novo mercado está desabrochando. Em um extremo, um grupo cada vez maior de start-ups oferece plataformas e aplicativos semânticos para uso corporativo. Hakia, Siderean, ZoomInfo, Cognition Technologies e Metacarta são apenas algumas das que estão comercializando sistemas de busca semânticos. Outros fornecedores, como Franz, SchemaLogic, Cambridge Semantics, TopQuadrant e Semantra, oferecem apps e soluções que podem ser acopladas às infraestruturas de TI corporativas e se direcionam a solucionar diferentes necessidades de empresas.

Eles competem mais diretamente com os gigantes da indústria, como Microsoft, SAP, Adobe, Oracle e IBM, que ignoraram o mercado até pouco mais de dois anos atrás e agora abraçam a web semântica para competir em todos os níveis de produtos. A SAP tem sido uma das empresas mais comprometidas em impulsionar o desenvolvimento da terceira geração da web. Em outubro de 2010, como parte de um projeto que visa criar um ecossistema tecnológico corporativo que combine as tecnologias semânticas com um software de inteligência de negócios, pesquisadores da Sheffield Hallam University, da Inglaterra, receberam US$ 544 mil em fundos da Comissão Europeia para dar vida ao CUBIST (Combining and Uniting Business Intelligence with Semantic Technologies).

O projeto, liderado pela SAP, tem como meta desenvolver o primeiro marco de business intelligence semântico para que cada empresa possa criar uma estrutura sob medida a partir da enorme quantidade de dados da web. Na área de marketing e publicidade, uma nova geração de ferramentas semânticas começou a inundar o mercado. Aplicativos mais intuitivos, como os fornecidos por Peer39, Wingify, OpenAmplify e AdPepper, estão ajudando os anunciantes a afinar seus objetivos, combinar o anúncio com o conteúdo apropriado e dirigir-se ao público-alvo com a precisão de um laser.

Por compreenderem o significado do texto e não trabalharem sobre uma base de palavras--chave, mas de conceitos, os sistemas semânticos também estão ajudando as marcas a se esquivar de contextos negativos. Hoje, a Philip Morris ou o McDonald’s, por exemplo, podem evitar as histórias que falam dos riscos do tabaco ou da fastfood para a saúde.

Inúmeras possibilidades

Em 2006, a Renault mudou de rumo. As opções enlatadas oferecidas pelos fornecedores de sistemas especializados não serviam para o objetivo da montadora: desfazer-se dos manuais impressos de procedimentos de diagnóstico de falhas e criar um sistema computadorizado para executar esses processos em tempo real.

François-Paul Servant, especialista em tecnologias semânticas da empresa, pôs-se a projetar uma ferramenta de indução probabilística para o diagnóstico de falhas nos veículos. “No início, nossos sistemas de informação não conseguiam fornecer ao programa de diagnóstico os dados necessários, especialmente porque não estavam disponíveis com o nível de granularidade exigido, exceto, ocasionalmente, como texto desestruturado”, conta ele. “Depois, os aplicativos empresariais não permitiam fazer consultas livres do tipo ‘Quais são os passos preliminares para testar a resistência do ar-condicionado em um Renault Clio?’”

Os sistemas de gestão específicos do setor eram programados para lidar com documentos sobre diagnóstico e reparos, mas não para administrar os conceitos contidos ali. Segundo o especialista, muitos sistemas falavam dos consertos sem identificá-los formalmente; portanto, não havia como trocar informações sobre eles.

Até o final de 2008, Servant e sua equipe conseguiram desenvolver um sistema semântico para o diagnóstico que funciona com aplicativos de web e facilita a descoberta de mais informações sobre consertos. Em uma sessão normal de diagnóstico, o usuário é instruído a realizar testes com o veículo e inserir os resultados.

Projetada com o propósito de descrever todas as operações de análise e consertos possíveis, a base de dados se conecta a uma multiplicidade de fontes próprias e alheias (fabricantes de componentes e parceiros) e pode processar procedimentos de provedores em tempo real. Sem dúvida, como esses casos comprovam, muitos dos benefícios da web semântica estão ao alcance da mão. Mas a árvore é frondosa, e os melhores frutos ainda estão por amadurecer.

Razões para dizer sim às tecnologias semânticas:

  • Democratizam o acesso ao conhecimento ao impor padrões comuns para a codificação e consulta de dados.
  • Liberam a informação presa em silos departamentais.
  • Permitem maximizar o valor dos dados por meio de sua reutilização.
  • Melhoram as habilidades dos trabalhadores do conhecimento, que podem tomar melhores decisões sobre a base das novas relações estabelecidas entre os dados.
  • Integram-se facilmente às arquiteturas corporativas de TI e, com isso, habilitam a interfuncionalidade de plataformas díspares e reduzem a complexidade dos sistemas.
  • Reduzem o gasto com tecnologia no que toca aos custos de integração de sistemas.

Fontes: Revista HSM Management