sociedade na era do big data.pdf

Download Sociedade na era do big data.pdf

Post on 21-Dec-2015

217 views

Category:

Documents

5 download

Embed Size (px)

DESCRIPTION

O big data e o futuro das informaes pessoais na era da internet

TRANSCRIPT

  • 1

    A sociedade na era do big data: Dados demais, filtros de menos

    Pedro Alexandre Cabral 1 Gustavo Said 2

    Resumo: O armazenamento da informao caracterstica intrnseca ao ser humano. Desde as eras mais remotas o homem sempre pautou-se pela eminente necessidade de registrar dados. Entretanto, nos dias atuais, com a profuso da internet, essa quantidade de informaes alcanou um crescimento exponencial. Nesse contexto, o presente trabalho tem como objetivo analisar como tcnicas de data mining podem ajudar na produo de conhecimento em contextos em que o pesquisador lida com grandes volumes de dados. Para tanto, ser realizada uma contextualizao acerca da sociedade na era do big data, de forma especial nos cenrios que tangenciam a orquestrao de criao de dados a partir das redes sociais. Alm disso, ser realizada uma incurso epistemolgica acerca do tema, pontuando a aplicabilidade do datamining em meio a esses massivos volumes de dados, tendo como aporte terico TURBAN (2005), LIMA JR (2004), dentre outros. Palavras-chave: Big data, data mining, redes sociais .

    1 Pedro Alexandre Cabral Bacharel em Administrao pela Universidade Estadual do Piau UESPI. Especialista em Administrao Estratgica pelo Centro de Ensino Unificado de Teresina- CEUT. Mestrando em Comunicao no PPGCOM da UFPI. E-mail: pedroale@pedroale.com. 2 Gustavo Said doutor em Cincias da Comunicao pela Unisinos. Professor do Programa de Ps-Graduao em Comunicao da Universidade Federal do Piau. E-mail: gsaid@uol.com.br.

  • 2

    1 INTRODUO

    O armazenamento da informao caracterstica intrnseca ao ser humano. Ao

    analisar a histria percebemos que desde os primrdios o homem carece da necessidade de

    guardar informaes: figuras rupestres em cavernas ou escritas em paredes de pedras

    encravadas nas pirmides egpcias so apenas alguns exemplos. Isto tambm visto nas

    culturas que somente dominam a linguagem oral, na busca de perpetuar o antigo por

    intermdio da oralidade (LIMA JUNIOR, 2011).

    Hoje, a penetrao da internet e das tecnologias digitais no cotidiano do cidado

    comum alavancou uma incrvel mobilidade e ubiquidade comunicacional e informacional

    no nvel do indivduo, e no mais apenas no nvel das organizaes, catalisando assim, tanto

    o controle e a transparncia, quanto s possibilidades de auto exposio em nveis inditos

    na nossa histria (GABRIEL, 2010).

    O valor mais acessvel de mquinas computacionais (processamento e memria) e dos

    dispositivos de captura e armazenagem de dados (sensores, cmeras fotogrficas e de vdeo,

    celulares, pen-drives, flash memory, discos rgidos externos, etc.) criaram inimaginvel

    quantidade de dados, que esto sendo disponibilizados na Web, proporcionando a formao

    da Era do Big Data (LIMA JUNIOR 2011).

    Em outro trabalho desenvolvido em 2012 , intitulado de Big Data, Jornalismo

    Computacional e Data Journalism: estrutura, pensamento e prtica profissional na Web de

    dados, Lima Junior (2012, p. 211) define Big Data (BD) como sendo um

    [...] conjunto de dados (dataset) cujo tamanho est alm da habilidade de ferramentas tpicas de banco de dados em capturar, gerenciar e analisar. A definio intencionalmente subjetiva e incorpora uma definio que se move de como um grande conjunto de dados necessita ser para ser considerado um big data.

    Como o autor prope, no existe uma definio precisa acerca do Big Data, entretanto

    autores como Zikopoulos et al (2012) advogam que o BD caracteriza-se pela presena de

    quatro aspectos: volume, velocidade, variedade e veracidade. Volume refere-se, como o

    prprio nome sugere, a quantidade de dados disponvel na internet e que nos ltimos anos

    vem crescendo de forma exponencial. A velocidade diz respeito a rapidez que os dados

  • 3

    podem ser capturados e processados. Variedade, por sua vez, pauta-se nas diversas fontes de

    dados em que estes podem ser encontrados e o ltimo aspecto, veracidade, abrange com

    caracterstica o fato que estes dados no apresentam uma verdade absoluta, ou seja, certa

    incerteza onde deve-se observ-los com muita parcimnia para que os mesmos possam

    gerar informaes teis e oportunas.

    Isto posto, o massivo crescimento de dados na internet traz consigo grandes bices no

    que tange a disponibilizao da informao. Ao digitarmos a palavra identidade no

    Google, por exemplo, encontramos aproximadamente 834.000.000 resultados3, dificultando

    o processo de seleo e interpretao das informaes por parte do usurio. Outro grande

    problema, segundo Sprink, Wolfram et al (2001) a dificuldade encontrada pelos usurios

    em expressar a necessidade de informao por meio de palavras chaves, visto que

    aproximadamente cinquenta e dois por cento das buscas realizadas nas mquinas so

    reformuladas.

    Dentro dessa nova perspectiva de utilizao das bases de dados, Machado e Palacios

    (2007), em estudo sobre as competncias dos profissionais de Comunicao, citam a

    existncia de pesquisas que tratam sobre a prtica dos profissionais da rea, em especial a

    necessidade destes se adaptarem s novas exigncias do mercado, tendo o domnio dos

    processos de digitalizao da informao.

    Dentre as competncias digitais compiladas no estudo citado, eis algumas: uso bsico

    do computador como ferramenta para busca, avaliao e classificao de informaes;

    cultura de internet (MACHADO e PALACIOS, 2007, p.79); conhecimentos bsicos e

    utilizao de programas de edio de texto, tratamento de imagem, udio, programao

    visual; conhecimento terico sobre redes e seu funcionamento e alta capacidade de

    aprendizagem de uso de novos programas.

    Para Lima Junior (2011), a capacidade e facilidade em reunir e armazenar informaes

    em um banco de dados, assim como sua utilizao, cresce a cada dia e na mesma proporo

    que novas tecnologias so desenvolvidas e propagadas para facilitar o trabalho do

    consumidor. Com a popularizao da rede mundial de computadores, quase todo e qualquer

    contedo produzido passa a ser colocado em um espao considerado at ento infinito,

    3 Pesquisa realizada em 05/07/2014

  • 4

    reflexo tambm da atualizao de produtos comunicacionais palpveis, como revistas,

    jornais e principalmente livros.

    Nesse contexto, organizaes de toda a ordem, bem como usurios comuns, esto

    migrando seus contedos para os discos rgidos dos computadores. Logo, a atividade em

    reunir a maior quantidade de informaes e disponibilizar de forma organizada, simples e

    objetiva, comea a se tornar uma tarefa obrigatria no mundo da comunicao, mas

    concomitantemente rdua e repleta de rudo. O modo mais clssico de armazenamento de

    informao atravs da palavra escrita, impressa. O acesso informao estocada dessa

    forma lento, difcil e de pouco rendimento. Para todas as etapas da manipulao da

    informao necessria a presena do ser humano, e suas limitaes na capacidade de

    aquisio de dados e processamento de grande volume de informaes constituem o

    principal gargalo do processo (MANDEL, SIMON, & DELYRA, 1997).

    Inobstante a este excesso de dados, a quantidade de informaes produzidas

    encontra-se, em sua maioria disposta em base de dados no estruturadas, ou seja, base de

    documentos textuais, cujo formato est adequado ao homem que, somente atravs da leitura,

    capaz de decodificar a informao contida no texto e aprend-la (SCHIESSL, 2007).

    Frente a este contexto de enormes mananciais de dados, a fim de prover uma fluidez e

    agilidade no manuseio da informao, existe uma necessidade premente de associar novas

    tecnologias ao contexto atual onde, dentro do nosso entendimento, as pesquisas atuais em

    comunicao j no conseguem resolver suas inquietaes face a este grande volume de

    dados. Assim sendo, sugere-se que exista uma interdisciplinaridade maior com outras reas,

    sobretudo as que advm das cincias da computao.

    2 REDES SOCIAIS E O EXCESSO DE DADOS

    A sociedade contempornea est cada vez mais imersa em redes de conexes digitais,

    nas quais os fluxos de informaes esto quase sempre associados a uma incua conversa

    polissmica nos mais variados canais. A conectividade d lugar construo de novos

    artefatos tecnolgicos, mas pode-se perguntar se ela est, de fato, a servio de uma

    necessidade bsica da existncia humana: a socializao.

    Mesmo antes do surgimento da internet essas interaes sociais, via tecnologia, j

    eram percebidas. O processo se deu com o surgimento dos meios de transporte e de

  • 5

    comunicao (MCLUHAN 1964). Com o uso e acesso a novos servios e produtos

    tecnolgicos, sobretudo os advindos da internet e, de uma forma mais fecunda as redes

    sociais, temos percebido a articulao de plataformas tecnolgicas para formao de novas

    comunidades e criao de mecanismos cada vez mais interacionais, onde, possivelmente, se

    renovam de forma intensa e reforam a construo de discursos polifnicos e dialgicos.

    Ainda dentro deste prisma, nota-se que a evoluo tecnolgica vem refletindo

    diretamente sobre as sociedades e principalmente sobre o comportamento humano.

    Percebemos que houve um crescimento exponencial de Tecnologias de Informao e

    Comunicao (TICs) nos ltimos sculos. De modo geral, todas essas tecnologias

    impulsionaram uma nova lgica social e cultural que, dentro desta premissa, o homem passa

    a ser criador e usurio das ferramentas tecnolgicas, apropriando-se das possibilidades

    tcnicas e, simultaneamente, sendo afetado