O que ciência da computação pode aprender com a biblioteconomia e com a ciência da informação

Kalev Leetaru

5 anos atrás

Os currículos de ciência da computação há muito enfatizam o poder dos dados, incentivando sua coleta e acumulação, abrindo caminho para novas formas de mineração e manipulação de usuários por meio dele, reforçando-o como o caminho para a riqueza na economia moderna e proselitizando a ideia de que os dados podem resolver todos os problemas dos males da sociedade.

Por outro lado, os currículos de bibliotecas e ciências da informação enfatizam historicamente a privacidade, as liberdades civis e o impacto na comunidade, combinando a discussão do gerenciamento de dados públicos com a minimização de dados privados. Os futuros líderes de tecnologia do futuro poderão aprender muito com seus colegas de biblioteca.

Como jovem estudante de ciência da computação no que era o programa de ciência da computação no 4º lugar no país (hoje nº 5), meus cursos foram preenchidos com todo tipo de prática e teoria sobre como adquirir, gerenciar e explorar os maiores conjuntos de dados do mundo.

O foco estava na capacidade do que “poderia” ser feito com dados, e não do que “deveria” ser feito com eles. A ideia de que uma conquista técnica deveria ser evitada, porque poderia prejudicar a sociedade, nunca foi levantada. A ideia de que os dados deveriam ser minimizados para proteger a privacidade nem sequer era um conceito. O design de sistemas seguros enfatizou como proteger os dados contra acesso não autorizado, mas nunca o conceito de como proteger os usuários, cujos dados estavam danificados.

Nunca foi apresentado o conceito de um Conselho de Revisão Institucional ou o conceito de avaliar o dano social da pesquisa, mesmo quando os conselhos de revisão de segurança e arquitetura eram um tópico de discussão regular.

Por outro lado, como um estudante de doutorado no programa de biblioteconomia e ciência da informação (LIS) da universidade, a poucos quarteirões de distância, era como entrar em um mundo totalmente novo.

O conceito de dano social foi trazido à tona no primeiro semestre, enfatizando a ideia de evitar pesquisas promissoras que poderiam causar danos significativos a comunidades vulneráveis, a ideia de revisão de pesquisa pelo IRB e a noção de que até mesmo dados público para download, como mídias sociais, os conjuntos de dados ainda exigiam uma consideração completa dos riscos e uma revisão ética completa.

Os algoritmos não eram mais pilhas de código, eram uma compilação de suposições, prioridades, visões de mundo e preconceitos humanos que guiavam a criação desse algoritmo em particular, e não um muito semelhante, mesmo que o próprio código fosse produzido por meio de aprendizado de máquina. De fato, esses são conceitos ainda ausentes da ciência da computação atualmente, onde os modelos são descritos como substitutos “imparciais” para programadores tendenciosos.

A segurança dos dados não era mais a “cibersegurança” centrada na tecnologia, mas a “privacidade” centrada no usuário, onde salvaguardar os dados significava proteger o usuário contra danos, não apenas bloquear um servidor. Mesmo além dos conceitos de privacidade e dados, existe um vasto mundo em que os programas LIS podem ensinar aos cientistas da computação como pensar em seus usuários.

A frente e o centro do mundo LIS é o estudo de como as pessoas buscam, consomem e agem com base em informações. Que os artistas não apenas apadrinham as bibliotecas de arte, mas consomem vorazmente todo o material disponível sobre um assunto que estão representando, procurando entendê-lo não apenas em sua dimensão física necessária para a representação, mas também em seu significado, motivação e impacto social mais profundos. Embora pouca surpresa para os especialistas em arte, tais insights sobre como diferentes disciplinas buscam e utilizam informações oferecem insights poderosos sobre como podemos projetar melhores plataformas de informações.

Uma compreensão mais profunda do comportamento das informações pode ajudar as plataformas a projetar sistemas mais resistentes à propagação de falsidades digitais e evitar armadilhas comuns.

Algumas aulas de “uso e usuários de informações” e a primeira no treinamento de bibliotecários de referência poderiam ter ajudado as plataformas de mídia social a evitar as armadilhas comuns do efeito de tiro pela culatra em seus esforços de “notícias falsas” e talvez até mesmo evitar a ideia de viralidade da regra da máfia de priorização algorítmica baseada em primeiro lugar.

Uma compreensão da evolução global de como as sociedades geraram, gerenciaram, consumiram e utilizaram informações ao longo da história e, especialmente, as maneiras pelas quais as sociedades em todo o mundo diferiram em suas abordagens, podem oferecer uma orientação poderosa na configuração dos sistemas de informação atuais. No lugar da visão centrada no Ocidente do gerenciamento de informações, a interação entre informação e sociedade em outras partes do mundo oferece inúmeras lições sobre como combater a disseminação de falsidades digitais, influência estrangeira e manipulação intencional indutora de violência atualmente.

As maneiras pelas quais as sociedades passadas abordaram a escassez de informações e a evolução do modelo de gatekeeping [conceito jornalístico para edição a partir do qual se define o que será noticiado de acordo como valor-notícia, linha editorial e outros critérios] também têm muito a ensinar às plataformas que lutam com o modo de moderar suas informações para todos. A diferença entre evidência e interpretação, perícia e experiência, informação e conhecimento, tudo tem muito a contribuir.

A teoria da catalogação pode ajudar os pesquisadores atuais de IA [inteligência artificial ] a contemplar como construir seus classificadores taxonômicos, enquanto os abstratores e bibliotecários de referência podem transmitir sua imensa sabedoria e experiência nos assistentes digitais de amanhã, alto-falantes inteligentes e sistemas de perguntas e respostas.

No entanto, os currículos do LIS são muito mais do que gerenciar arquivos de artefatos físicos e assinaturas eletrônicas. O envolvimento da comunidade há muito tempo é uma grande ênfase, com disciplinas como “informática comunitária” enfatizando como as tecnologias da informação e comunicação podem capacitar e fortalecer as comunidades.

Em um mundo digital em que “valor” é tipicamente definido por “interesse do anunciante”, as principais plataformas da Internet podem aprender muito com um pensamento mais amplo sobre como suas ferramentas capacitam ou reprimem a comunidade e as mudanças significativas que eles podem fazer para apoiar melhor as comunidades vulneráveis.

De fato, grande parte do dano causado pelas plataformas sociais nas comunidades vulneráveis do mundo, suas contribuições à violência étnica, genocídio, crimes de ódio e outros horrores poderiam ter sido consideravelmente mitigados se as empresas desde o início tivessem abordado seus projetos de mentalidades centradas na comunidade, em vez de construir um sistema à sua própria imagem e responder a cada dano com as palavras de hoje “opa o nosso erro, mas ninguém poderia ter previsto isso” como respostas.

Os pesquisadores de informática da comunidade estudam essas mesmas questões e muitas das falhas de hoje nas mídias sociais são estranhamente reminiscentes dos tópicos abordados nas aulas que eu mesmo fiz anos atrás.

Infelizmente, no entanto, como as escolas de biblioteconomia e ciência da informação passaram por uma onda de rebrandings [estratégia de marketing, no qual uma organização decide alterar a sua denominação, ou o seu logotipo, ou o seu design, ou outros elementos identificativos, para formar uma nova identidade] na década passada em “iSchools”, essa ênfase na minimização e privacidade de dados, uso e usuários de informações, informática da comunidade, liberdades civis e a dimensão humana da informação a criação e o consumo têm sido constantemente corroídos em favor da mesma colheita, acumulação, mineração e manipulação que antes eram o domínio exclusivo dos programas de ciência da computação.

No que seria impensável durante minha própria gestão, os candidatos a emprego LIS atraídos pela ciência da computação estão cada vez mais descartando a privacidade, os danos sociais, a revisão ética e o envolvimento da comunidade em favor do entendimento orientado a dados a todo custo.

Uma palestra de trabalho do LIS particularmente marcante que participei contou com um cientista da computação que orgulhosamente anunciava como eles haviam colhido vastas faixas dos principais sites de mídia social e serviços de assinatura e os redistribuíam livremente para pesquisadores de todo o mundo, violando diretamente os acordos legais, detalhando seu trabalho em desmascarar comunidades vulneráveis, divulgou seus anos de trabalho promovendo campanhas governamentais de influência estrangeira, dispensou a utilidade e a necessidade da revisão ética do IRB e apresentou uma visão para trabalhar em estreita colaboração com governos e empresas do Vale do Silício para alavancar as abordagens LIS para construir a melhor máquina de vigilância. Em vez de ser vaiado pela plateia, esse indivíduo foi abraçado com entusiasmo e não apenas foi contratado, mas também se tornou diretor de pesquisa.

Infelizmente, na medida em que as escolas de biblioteconomia e ciência da informação ingressam nas iSchools e contratam vagas de cientistas da computação, as tradições acadêmicas do foco humano centrado na comunidade do LIS estão dando lugar ao foco técnico da ciência da computação orientado por dados.

No final, há muito que os cientistas da computação podem aprender com a comunidade de bibliotecas e ciências da informação. Se eles se apressarem, poderão aprender um pouco disso antes que tudo dê lugar à onda baseada em dados que atravessa a academia.

*Publicado originalmente na Forbes sob o título “Computer Science Could Learn A Lot From Library And Information Science”. Tradução: Chico de Paula

Comentários