resenha do livro: Mineração da Web Social

O que alguém pode descobrir mais sobre seus tweets, e as pessoas que retweet e responder a elas? Em vez muito: apesar de ser limitado a 140 caracteres, os tweets incluem metadados, como o tipo de codificação de caracteres que eles usam, e muito mais.

Mobilidade; hands-on com um Samsung Galaxy S7 Edge on República sem fio: A melhor Wi-Fi experiência de chamada; primeiro take: Um tablet Android resistente para ambientes difíceis, mobilidade; hands-on com os Plantronics BackBeat GO 3 e Voyager 5200 fones de ouvido: perfeito para o novo iPhone da Apple

Você pode ver como as pessoas amigáveis ​​estão no Twitter e como eles estão interligados. Você pode ver como influente alguém é, e que eles influenciam, que os influencia, que eles acham que está falando sobre algo interessante o suficiente para repetir (sem que seja distorcido pela freqüência com que os tweets de pessoas interessantes), se eles apenas seguem e responder a pessoas que são semelhantes a eles, se eles estão em um grupo exclusivo grande ou pequeno de usuários conectados, se as pessoas falam ao mais são seus amigos mais próximos – e se algum de que é recíproco. E você pode vê-lo por muito mais pessoas do que você poderia analisar apenas percorrendo o seu feed do Twitter.

Este é o tipo de informação que ferramentas como Klout usam para classificar e marcar os usuários do Twitter, mas os dados brutos é acessível e você pode mina até os últimos 3.000 tweets usuários públicos para analisar para que você possa fazer suas próprias perguntas. Você poderia definir um perfil e procurar por usuários do Twitter que combinem com ele, ou descobrir o que é mais provável para tweet ou retuitar hora do dia alguém. E você pode obter instruções passo-a-passo para fazer quase tudo isso, juntamente com as visualizações das conexões e relacionamentos, usando as instruções na Mineração de Matthew A. Russell da Web Social.

Russell também cobre o que você pode deduzir a partir de perfis do LinkedIn. Isto é tanto mais limitado, porque embora você pode obter um monte de informações sobre pessoas em sua rede LinkedIn, você pode nem mesmo saber se duas pessoas arbitrárias têm qualquer ligação (uma decisão deliberada pelo LinkedIn para proteger a privacidade dos usuários), e muito mais rica por causa da quantidade de usuários detalhe colocado em seu perfil e como estruturada que a informação é. , Bem como ver que você sabe quem nunca teve um emprego em uma empresa que deseja aplicar a (o tipo de coisa LinkedIn já é útil para) você pode olhar onde as pessoas com cargos específicos baseiam-se, para ver se vale a pena edifício um negócio ou executando uma oficina em uma área particular.

O capítulo sobre Facebook ressalta que você pode obter um token de desenvolvedor em dez minutos, e sugere idéias de mineração interessantes como analisar quantas pessoas afastaram-se onde eles cresceram ou foram educados. O Russell não negligenciar a rede social que tem a informação mais interessante – sua caixa de entrada.

O livro começa com uma citação de Tim Berners-Lee sobre a natureza social original da web: “Nós se agrupar em famílias, associações e empresas que desenvolvem a confiança através das milhas e desconfiança em torno do canto.”. As ferramentas e técnicas aqui deixá-lo ver apenas como isso é verdade. Nenhum deles iria ajudá-lo erguer em informações que não era pública, em primeiro lugar, mas é uma grande demonstração de muito bem como grande parte das informações que colocamos em serviços on-line é público e está disponível para a mineração nessas formas.

Se você quiser usar os exemplos de programação neste guia densa, mas veloz, você precisa estar confortável com Python e com o mergulho em código. Mas o que se obtém são ferramentas utilizáveis ​​em vez de exemplos de brinquedo. Há algumas estatísticas interessantes (apenas metade de tweets conter um hashtag ou nome de outra twitterer), uma boa visão geral da teoria dos conjuntos e desvios fascinantes sobre o que pode e não pode fazer com o processamento da linguagem natural (se você quiser extrair blogs como poço) e as idéias da web semântica. O único problema é que o livro aborda uma ampla gama de serviços e fontes de informação que é apenas um aperitivo para o que você poderia fazer pela mineração cada um deles tal – especialmente o Facebook.

Se você quer apenas um guia para a quantidade de informação pode ser extraída de redes sociais com uma quantidade moderada de habilidades de programação, você pode ignorar os detalhes de codificação e concentrar-se nas explicações e sugestões para análise e visualização. Você vai sair com uma visão realista do que a web social pode realmente nos dizer sobre as ligações, interações e as deduções que você pode fazer com eles.

Mineração Social Web: Analisando dados do Facebook, Twitter, LinkedIn e outros sites de mídia social; Matthew A. Russell; O’Reilly Media; 360 páginas; ISBN: 978-1-4493-8834-8; R $ 30,99

Mary Branscombe

Hands-on com um Samsung Galaxy S7 Edge on República sem fio: A melhor Wi-Fi experiência de chamada

Microsoft enérgico, First Take: Criar conteúdo atraente em seu smartphone

Xplore Xslate D10, First Take: Um tablet Android resistente para ambientes difíceis

Hands-on com os Plantronics BackBeat GO 3 e Voyager 5200 headsets: Perfeito para o novo iPhone da Apple