#vem coleta de dados relacionais

59
COLETA DE nas mídias sociais Marcelo alves

Upload: marcelo-alves

Post on 12-Apr-2017

624 views

Category:

Education


3 download

TRANSCRIPT

Page 1: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Marcelo alves

Page 2: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

instrutor

• Doutorando pelo PPGCOM/UFF;• Estuda comunicação política em rede;• Sócio-diretor da Vértice Inteligência;• Pesquisador do laboratório de mídia e democracia (LAMIDE/UFF), orientado por Afonso de Albuquerque;• Publica textos no blog www.marceloalves.org

Page 3: #VEM Coleta de dados relacionais

N = 532 fan-pagesA = 8.654 arestas

Rede antipetista na eleição de 2014

Page 4: #VEM Coleta de dados relacionais
Page 5: #VEM Coleta de dados relacionais
Page 6: #VEM Coleta de dados relacionais
Page 7: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

c

Quais objetos ou temas de

pesquisa dos alunos para

coleta de dados?

Page 8: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

O que você vai aprender

• O básico da concepção teórica da análise de redes;• Processos de coletas de dados relacionais;• Leitura da documentação da Graph API do Facebook• Métodos de construções de queries;• Funcionamento e prática com Facepager;• Extrair dados das pesquisas dos alunos;• Tratamento e manipulação de dados relacionais;• Importar dados no Gephi.

Page 9: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

c

CONCEITOS TEÓRICOS GERAIS

(prometo ser breve)

Page 10: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Lógicas da comunicação política em massa e em rede - Klinger e Svensson (2014)

Page 11: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Lógicas da comunicação política em massa e em rede - Klinger e Svensson (2014)

• Lógicas de rede não estão tomando o lugar da lógica de massa;• As plataformas de mídias sociais seguem outras regras do jogo;• A mídia de massa e o conteúdo jornalístico continuam sendo uma das principais fontes de informação;• As duas lógicas não são estáticas, mas estão em evolução

Page 12: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Sistemas midiáticos híbridos – Chadwick (2013)

• “O sistema midiático híbrido é baseado em conflito e cooperação entre lógicas novas e antigas; mas também possui considerável grau de interdependência entre estas lógicas” (Chadwick, 2013, p. 207)• Convergência midiática – ambos os sistemas estão entrelaçados • Partidos, imprensa e movimentos sociais tradicionais estão se adaptando às lógicas de rede

“Conteúdo nas plataformas de mídias sociais nem sempre é gerado pelo usuário, mas frequentemente envolve referências aos meios de massa. A mídia tradicional também busca aprender distribuições

virais como uma base de um novo modelo de negócios. Usuários de mídia diversificaram suas dietas noticiosas e começam a navegar em sistemas midiáticos híbridos. No entanto, a sobreposição não

torna as lógicas midiáticas indistinguíveis, porque são modus operandi muitos distintos. É tarefa dos estudos empíricos distinguir e medir as lógicas de massa e de rede em casos específicos” (Klinger e

Svensson, 2014, p. 12).

Page 13: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Repertórios digitais em redes e hibridismo organizacional (Chadwick, 2007)

Duas tendências paralelas 1) Organizações políticas tradicionais estão adotando e modificando seletivamente características de movimentos sociais;Quatro repertórios principais: (a) mobilizando formas online de ação dos cidadãos; (b) articulando ligações entre diferentes grupos; fundindo discurso políticos e subculturais e (d) aproveitando-se de redes sedimentárias.

“Há sinais crescentes de que organizações tradicionais, mais hierárquicas, menos inovadoras –como grupos de interesse e partidos – estão começando a se adaptar e adotar repertórios digitais em

rede” (Chadwick, 2007, p. 286)

2) Novas formas organizacionais que só podem existir na internet estão surgindo.“Organizações ainda mais radicais estão surgindo, como o MoveOn, que mistura repertórios ou

rapidamente troca de um conjunto de ações para outras. Quando se trata de ação coletiva potencializada pela internet, a imitação é parte da inovação. O conceito que melhor da conta deste

resultado é a hibridez organizacional”

Page 14: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

O ciclo de informação política – Chadwick (2011)

Ciclo noticioso = período do dia previsível no qual se produzem as notícias, o tempo para selecionar, apurar, escrever, editar, compilar e apresentar material jornalístico. • Fenômeno explorado pelos autores de sociologia do jornalismo e da comunicação sobre os ciclos produtivos das redações e a noticiabilidade• Construção da notícia é um processo rigidamente controlado e envolve negociações entre a elite política e midiática

Ciclo de informação política = bricolagem entre lógicas de massa e de rede na produção de informação política.• Maior número e maior diversidade de atores• Estruturas temporais mais rápidas e complexas• Inclui participantes que tangenciam as elites políticas e midiáticas• Diversificação das fontes de informação•Deslocamento do jornalismo, ou do jornalismo liberal, como balizador da produção de informação.

Page 15: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

O que temos até aqui?

• Uma série de mudanças tecnológicas, sociais e organizacionais na comunicação política.• As elites perdem a exclusividade do acesso e do controle de meios de criação de informação.• Diversos repertórios de expressão política surgem para além das burocracias partidárias e jornalísticas.• Tudo isso está em permanente movimento e relacionamento.

A delimitação dos corpus de pesquisa em meios de massa é bastante simples. As notícias publicadas no jornal X ou as peças publicitárias televisivas durante o período eleitoral. O objeto

é a cobertura da imprensa ou propagandas políticas oficiais.Frequentemente, os estudos mais recentes escolhem um ator e dedicam-se apenas a ele, por exemplo, a produção da Mídia Ninja. Porém, essa abordagem perde as dinâmicas relacionais

criadas em torno daquele agente e todas as negociações com os demais envolvidos.

Page 16: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

c

Contudo, num ambiente midiático híbrido, com surgimento de blogs,

lideranças de opinião nativas digitais e uma infinidade de outros

fenômenos, Como delimitar o corpus de

pesquisa?

Page 17: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Esfera pública em rede (Benkler et al. 2013, p. 04) – conceito provisório

• A esfera pública em rede é uma arena alternativa para o discurso e debate público, uma arena que é menos dominada pelas grandes organizações midiáticas, menos sujeita ao controle do governo e mais aberta a participação ampla.

• A esfera pública em rede é manifesta como um ecossistema complexo de canais de comunicação que coletivamente oferecem um ambiente que conduz a expressão política e a criação de diversas formas organizacionais.

• Uma série de estudos já evidenciou que elites políticas e midiáticas continuam dominando o centro das esferas públicas em rede (Soon e Cho, 2011; Asserhofer e Maireder, 2012; Kocks, 2016 . No entanto, aceitam a abertura para ações de indivíduos não organizados.

Page 18: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

O que são redes sociais? (WASSERMAN e FAUST, 1994)

• A diferença fundamental entre análise de redes e análise estatística é a inclusão de conceitos e de informações sobre os relacionamentos entre as unidades de análise do estudo.• Em vez de focar nos atributos das unidades individualmente, estuda as características como emergentes do processo de relacionamento social.• O conceito de redes enfatiza que cada indivíduo tem ligações com outros indivíduos;• As Redes Sociais referem-se a um conjunto de atores e as relações entre eles;• Modelar a estrutura e buscar compreender sua influência no grupo

Page 19: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Componentes básicos da análise de redes

cator

claços

cclusters

crede

Componente individual

Ligações entre atores

Subconjuntos identificados pela densidade

Totalidade de atores e ligações da amostra

Page 20: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

c

O que são dados relacionais?Duas informações distintas

Atributos dos atoresArestas de saída e chegada

Page 21: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Métodos digitais – Richard Rogers (2004)

• A web como fonte de dados;• Virada computacional nas ciências sociais;• Rastros gerados espontaneamente• Análises de hiperlinks• Blogosferas políticas • Repercussão no Twitter• Comunidades no Facebook

Page 22: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Dois tipo s de redes na internet (recuero, 2009)

• Redes associativas ou de filiação – possuem ligações mais estáveis, duradouras. Gera o efeito de filiação a um grupo. Exemplo: seguir páginas e fazer amizades;

• Redes emergentes – são compostas por ligações circunstanciais, criadas a partir de ações comunicativas ad hoc. Exemplo: menções, retuítes, compartilhamentos.

Page 23: #VEM Coleta de dados relacionais
Page 24: #VEM Coleta de dados relacionais
Page 25: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

c

O que são APIs?Application

programming interface

Page 26: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Políticas de cessão de dados da facebook graph api

• As políticas de cessão de dados de cada plataforma são documentadas nas APIs;• APIs são tanto documentos técnicos, quanto reflexos das diretrizes empresariais de fornecimento de dados;• APIs são modificadas frequentemente, de acordo com as necessidades e interesses mercadológicos das organizações;• As documentações mostram quais requisições são possíveis (queries), em qual volume (rate limit) e com quais parâmetros.

Page 27: #VEM Coleta de dados relacionais

Versionamento das apis do facebook

COLETA DE

nas mídias sociais

Page 28: #VEM Coleta de dados relacionais

Vamos praticar?

https://developers.facebook.com/tools/explorer/

COLETA DE

nas mídias sociais

Page 29: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Como construir uma query? Orientação a id

• {id} + fields = {campos}• Retorno em Javascript Object Notation (JSON)• JSON é exibido na tela e convertido para tabulação

• Construindo query no navegador• https://graph.facebook.com/v2.6/ + id / {requisição} ?access_token= {token de acesso}https://graph.facebook.com/v2.6/dilmarousseff/likes?access_token=EAACEdEose0cBAErGN0ycFbkfEzlhW8o0whxulUmELq3y0bZBVh0sxbNUtUvddkuF0vQmoz9zlUln9QG9oRypH75VEEI2HI39HlsN6rYA9vZCXWYvaVTkPRN585mUqS07AeCW9HHVOvo5wIiGDgfTtu8jNioAof51U4v1n5YQYZBr0tChVsQiblwFj6KOhkZD

Page 30: #VEM Coleta de dados relacionais
Page 31: #VEM Coleta de dados relacionais

Aplicativos acadêmicos

Page 32: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

cQual ferramenta

utilizar?

Page 33: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Diferenças nas apis de facebook e twitter

Page 34: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Técnicas de amostragem em métodos digitais (rieder, 2012)

• População – volume completo de usuários e publicações de uma determinada plataforma.Geralmente, é adquirido a partir da compra do banco de dados da empresa. Estudo utilizandodados populacionais = (Freelon et al., 2016);• Amostra aleatória: forma mais utilizada para garantir representatividade dos dados digitais. Noentanto, como não se sabe a população, há uma série de problemas derivados;• Amostra por tópicos: queries por palavras-chave e hashtags. É o método mais comum no Twitter. Todavia, não funciona no Facebook desde a descontinuidade da Graph API 1.0 em 2015.• Amostrar por marcações: compilada a partir de marcadores geográficos ou linguísticos oferecidos pela API. • Amostra por atores: seleciona determinados canais para coleta de dados. Frequentemente utilizado para estudo de campanhas eleitorais, focando nos candidatos ou partidos. • Amostra por grafos: Examina relações entre uma série de agentes e faz seleções baseado no resultado. Minha dissertação e tese. • Amostra manual: utilizada para projetos qualitaitivos, geralmente são amostras de conveniência.

Page 35: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Adaptando os métodos para coleta relacional no Facebook (cf. BRUNS E BURGESS, 2014)

• A API do Facebook não permite a coleta de dados por palavras-chave ou por hashtags.Método mais utilizado no Twitter, esta é uma das principais razões porque o Facebook éplataforma pouco utilizada em pesquisas de métodos digitais.• No entanto, o Facebook é a plataforma mais utilizada pela elite político-midiática e peloscidadãos comuns. Não estudar o Facebook é ignorar a ferramenta de mídias sociais queconcentra maior público.• Assim, surge a questão, como realizar desenhos de pesquisa especificamente para oFacebook?• A estratégia mais comum é focar em poucos atores, como as fan-pages de candidatosdurante períodos eleitorais. Embora viável do ponto de vista metodológico, essa opçãoignora todas as dinâmicas relacionais que acontecem em torno daqueles candidatos.• É isso que pretendo captar com meus projetos.• Para tanto, aposto no método de amostragem por grafos e bola de neve.

Page 36: #VEM Coleta de dados relacionais
Page 37: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Facepager - Till Keyling e jakob junger

• Ferramenta desenvolvida para a dissertação;• Código aberto;• Programando em Python 2.7;• Introduz boa parte dos conceitos de data mining, como query, datamunging, data storage, log de processos...• É uma interface para se comunicar com a API e fazer o trabalhopesado;• Alto grau de liberdade para os usuários operarem as requisições;• Funciona com Facebook e Twitter;

Page 38: #VEM Coleta de dados relacionais

Vamos praticar?

retorno

metadados

Json key

Sistemaquery

Page 39: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Etapas do mapeamento de fan-pages (BRUNS, 2007; ADAM et al., 2015)

• Lista de nós-sementes;• Nós-sementes devem ser temáticos e homogêneos.• Bola de neve – crawling com 1 ou 2 graus de profundidade;• Limpeza do resultado;• Manipulação de dados – lista de nós e arestas;• Importação no Gephi;• Categorização dos atores

Como montar uma lista de sementes?

Page 40: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

A função search

Notação: /search ? type= {user, page, event, group, place} & q={palavra+chave} & fields=

search?type=page&q=dilma+rousseff&fields=id,name,link,description,category

Fazer testes de acordo com as pesquisas dos alunos

Page 41: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

A função user like

Notação: id ? fields = likes {aninhamento de parâmetros}

dilmarousseff?fields=likes{name, category, id, link, about}

Fazer testes de acordo com as pesquisas dos alunos

Page 42: #VEM Coleta de dados relacionais
Page 43: #VEM Coleta de dados relacionais
Page 44: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Documentação das fan-pages

Query<user>/likes?fields=name,username,about,talking_about_count,fan_count,category,link,bio,description,emails,location,new_like_count,start_info,website,id

JSON keysname

idusernamecategory

aboutbio

descriptionfan_count

talking_about_count

emails.0website

linklocation.city

location.statelocation.longitudelocation.latitude

Page 45: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

cPrática de

mapeamento de fan-pages

Page 46: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

TRATAMENTO DE DADOS

Filtros para limpeza de logs;Preparação das listas de nós e arestas

ArestasFunçao PROC (=PROC(B684;$A$3:$A$506;$E$3:$E$506)Criar source e target

Nós – Eliminar duplicatas

Page 47: #VEM Coleta de dados relacionais
Page 48: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Meso level - a Documentação das publicações

Querycomments.limit(1).summary(true),likes.limit(1).summary(true),picture,story,from,to,description,source,link,created_time,message,type,id,status_type,name,story_tags,caption, reactions.limit(1).summary(true), shares

namefrom.namefrom.categoryfrom.idto.data.*.idto.data.*.namestory_tagssharedposts.dataposts.datastorylinkcaption

message_tagsmessagestatus_typetypeshares.countcreated_timeupdated_timereactions.summary.total_countlikes.summary.total_countcomments.summary.total_countshares.count

Page 49: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Fluxo de comuinicação entre as páginas

EndpointsLinks – referentes aos links compartilhados nas publicações. Sóregistrando quando a postagem é de tipo LINK;Caption – referente ao domónio do link;Message_tags – perfis marcados na mensagem (similar a @mention);Status_type – identificar compartilhamentos e links;Story_tags – fluxo de compartilhamentoTo – Perfis mencionadosWith_tags – Com quem estou.

Page 50: #VEM Coleta de dados relacionais
Page 51: #VEM Coleta de dados relacionais
Page 52: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

c

Prática de fluxos de

publicações

Page 53: #VEM Coleta de dados relacionais
Page 54: #VEM Coleta de dados relacionais
Page 55: #VEM Coleta de dados relacionais
Page 56: #VEM Coleta de dados relacionais
Page 57: #VEM Coleta de dados relacionais
Page 58: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

ReferênciasADAM, Silke et al. Identifying and Analyzing Hyperlink Issue Networks, In: VOWE ,Gerhard, HENN, Philipp.Political Communication in the Online World (Orgs), Routledge: New York, London, p. 233-247, 2015.ALVES, Marcelo. Coleta de dados nas mídias sociais. In: SILVA, Tarcízio; STABILE, Max (orgs.), Monitoramento ePesquisa emMídias Sociais: metodologias, aplicações e inovações, Uva Limão, 2016.BENKLER, Yochai. Political Freedom part 2: Emergence of the networked public sphere. The Wealth ofNetworks: How Social Production TransformsMarkets and Freedom, 2006.BRUNS, Axel. Methodologies for mapping the political blogosphere: An exploration using the IssueCrawlerresearch tool. First Monday, v. 12, n. 5, 2007.CHADWICK, Andrew. Digital network repertoires and organizational hybridity. Political Communication, v. 24, n.3, p. 283-301, 2007.CHADWICK, Andrew. The political information cycle in a hybrid news system: The British prime minister and the“Bullygate” affair. The International Journal of Press/Politics, v. 16, n. 1, p. 3-29, 2011.CHADWICK, Andrew. The hybrid media system: Politics and power. Oxford University Press, 2013.FREELON, Deen; MCILWAIN, Charlton D.; CLARK, Meredith D. Beyond the hashtags:# Ferguson,#Blacklivesmatter, and the online struggle for offline justice. 2016.KLINGER, Ulrike; SVENSSON, Jakob. The emergence of network media logic in political communication: Atheoretical approach. Newmedia & society, v. 17, n. 8, p. 1241-1257, 2015.RECUERO, Raquel. Redes sociais na internet. Sulina, 2009.RIEDER, Bernhard. The refraction chamber: Twitter as sphere and network. First Monday, v. 17, n. 11, 2012.ROGERS, Richard. Information politics on theWeb. MIT Press, 2004.WASSERMAN, Stanley; FAUST, Katherine. Social network analysis: Methods and applications. Cambridgeuniversity press, 1994.

Page 59: #VEM Coleta de dados relacionais

COLETA DE

nas mídias sociais

Obrigado!

[email protected]