Como extrair e-mails do LinkedIn

Como fazer, Raspagem, Jul-26-20215 minutos de leitura

O LinkedIn é a plataforma de rede social perfeita para profissionais, com 660 milhões de utilizadores, dos 303 milhões de utilizadores mensais activos. Por isso, se ainda não criou uma conta no LinkedIn, faça-o hoje mesmo. Pode conviver com gigantes da indústria. Neste artigo, vamos falar sobre como extrair e-mails de contas do LinkedIn. Muitas vezes, pode

O LinkedIn é a plataforma de rede social perfeita para profissionais, com 660 milhões de utilizadores, dos 303 milhões de utilizadores mensais activos. Por isso, se ainda não criou uma conta no LinkedIn, faça-o hoje mesmo. Poderá conviver com gigantes do sector.

Neste artigo, vamos falar sobre como extrair e-mails de contas do LinkedIn. Muitas vezes, pode precisar de endereços de correio eletrónico para os processos de recrutamento que a sua empresa utiliza frequentemente ou para campanhas publicitárias não intrusivas.

No entanto, a maioria dos utilizadores esconde os seus endereços de correio eletrónico por questões de privacidade. O LinkedIn também fornece mecanismos para ocultar esses endereços de correio eletrónico da vista do público. Assim, nestas circunstâncias, a única forma de aceder aos endereços de correio eletrónico é através de scraping. 

Assim, sem mais demoras, vamos descobrir como pode efetuar a recolha de correio eletrónico com o LinkedIn, mas primeiro vamos também descobrir porque é que precisa de recolher informação do LinkedIn.

Porquê extrair mensagens de correio eletrónico do LinkedIn?

Tal como referido no parágrafo introdutório, pode ser necessário para efeitos de recrutamento ou de marketing. Para elaborar um pouco mais, um perfil de utilizador no LinkedIn tem nomes, endereços de correio eletrónico, competências, experiência profissional, qualificações, etc. Por outro lado, os perfis das empresas contêm anúncios de emprego, número de empregados, empregados actuais e vários outros dados vitais.

Assim, o LinkedIn tem um manancial de informação que será imensamente benéfico para as pessoas.

Alguns utilizadores podem utilizar bots e crawlers para recolher e-mails e criar uma lista de e-mails. Depois, vendem essas listas de correio eletrónico a profissionais de marketing e a outros grupos que estão muito interessados nesses dados.

Dito isto, é necessário considerar também os aspectos éticos da recolha de correio eletrónico. Normalmente, é considerado pouco ético, mesmo que as intenções não sejam maliciosas. No entanto, a eficácia da recolha de e-mails do LinkedIn para construir relações profissionais não pode ser negligenciada.

Assim, a próxima secção centrar-se-á na legalidade da recolha de correio eletrónico do ponto de vista do LinkedIn, com um exemplo.

O LinkedIn permite alguma forma de scraping?

A resposta é um grande não-não, para que a mensagem fique bem clara. A documentação do LinkedIn sobre "Software e Extensões Proibidos" proíbe estritamente a utilização de crawlers, bots, robots, scripts e quaisquer outros add-ons ou plug-ins para raspar o sítio Web do LinkedIn. Pode ler mais sobre a utilização de scrapes no LinkedIn na hiperligação acima para ter uma ideia do que se trata.

O LinkedIn aplicou a maior parte destas regras para proteger a privacidade dos seus membros. No entanto, existem zonas cinzentas em algumas destas leis anti-raspagem. Digo isto porque, há algum tempo, o LinkedIn processou 100 "scrapers" anónimos por terem extraído dados do LinkedIn, mas ainda não foi dado um veredito ao caso. Isto também se deve ao facto de o LinkedIn não ter conseguido distinguir uma boa raspagem de uma raspagem destrutiva.

O caso acima descrito resultou no surgimento de questões críticas na recolha de dados. No entanto, essas questões estão para além do âmbito deste artigo. Por isso, o que estou a tentar explicar aqui é que, se pretende extrair dados do LinkedIn, tem de estar ciente de que eles não gostam disso. Por isso, tem de o fazer corretamente, o que descobrirá nas próximas secções.

Como extrair mensagens de correio eletrónico do LinkedIn?

Para fazer o scraping de e-mails da forma correcta, é necessário considerar vários factores. Alguns desses factores críticos são:

  • Necessita de métodos manuais ou automatizados para a recolha de correio eletrónico?
  • Se vai utilizar métodos automatizados, quais são os parâmetros da aplicação que vai definir?
  • Que tipos de perfis e páginas vai extrair do LinkedIn (perfis públicos e privados que discutiremos mais tarde)? 
  • Irá utilizar proxies e, em caso afirmativo, quais são os tipos de proxies e quantos?

Por isso, na próxima secção, vamos analisar o método mais seguro e legítimo de extrair endereços de e-mail do LinkedIn.

Exportar manualmente os contactos do LinkedIn.

Esta é a forma mais segura e legítima de extrair mensagens de correio eletrónico do LinkedIn. 

Antes de o instruir sobre os passos para a exportação manual, uma palavra de cautela sobre este método; existe uma nova definição de privacidade no LinkedIn que permite apenas o acesso privilegiado aos IDs de correio eletrónico de um utilizador. No entanto, pode alterar esta definição para a opção "mais fraca". Ao fazê-lo, fica à mercê dos hackers que podem utilizar o seu endereço de correio eletrónico para actos maliciosos.

Assim, com este método, só poderá descarregar o endereço de correio eletrónico dos seus contactos directos. Além disso, está limitado a descarregar os e-mails que alteraram a sua definição de privacidade predefinida para "mais fraca".

De qualquer forma, seguem-se os passos que tem de seguir para descarregar os e-mails manualmente:

  1. Inicie sessão no seu perfil do LinkedIn com o seu ID de correio eletrónico e a sua palavra-passe.
  2. Navegar para a página inicial.
  3. Em seguida, localize o ícone Eu na barra de navegação superior.
  4. Clique no ícone pendente no ícone Eu.
  5. Seleccione definições e privacidade no menu pendente
  6. Em seguida, seleccione o separador "Privacidade" localizado na barra lateral esquerda
  7. Clique na primeira opção, que diz "Como o LinkedIn utiliza os seus dados".
  8. Inicie sessão se lhe for pedido para o fazer.
  9. Em seguida, será redireccionado para uma página de dados marcada; descarregue a sua opção de dados que se encontra por baixo.
  10. Nessa página, tem de selecionar as ligações de destino cujo correio eletrónico gostaria de visar.
  11. Depois, para terminar, siga as instruções no ecrã.

Em seguida, receberá uma mensagem de correio eletrónico com uma ligação para extrair os dados solicitados.

Utilização de ferramentas automatizadas

Como acabou de ver acima, utilizando o método manual, obterá apenas alguns resultados. Por conseguinte, é necessário utilizar um método alternativo sob a forma de ferramentas de automatização. Estas ferramentas de automatização são aplicações de rastreio destinadas apenas ao LinkedIn. Vamos descobrir algumas delas.

PhantomBuster - também chamado raspador de perfis do LinkedIn e é uma aplicação baseada na nuvem. Os gestores de RH e os recrutadores utilizam-na frequentemente para extrair dados valiosos, como endereços de correio eletrónico de potenciais candidatos ou empregados. Se os perfis alvo forem "ligações directas", pode extrair os detalhes facilmente. No entanto, para as "ligações indirectas", a extração de e-mails torna-se complicada. Pode encontrar mais informações sobre esta ferramenta aqui.

Octoparse-Esta é uma ferramenta de raspagem da Web muito inteligente, uma vez que utiliza apenas três passos para recolher dados. Primeiro encontra os dados, selecciona os dados e depois exporta-os. Oferece várias opções para guardar os dados, quer em CSV, XLSX, quer em diferentes plataformas, utilizando a chave API. Com ele, você pode usar servidores proxy para mascarar seus endereços IP ou usar uma rotação automática de IP para evitar uma proibição do LinkedIn. Leia mais para saber mais sobre o Octoparse.

SalesQL- Esta ferramenta é gratuita e é uma extensão do navegador Google Chrome. Por isso, pode adicioná-la facilmente ao seu navegador Chrome. Os representantes de vendas e os recrutadores utilizam frequentemente esta ferramenta para extrair e-mails do LinkedIn, independentemente de a ligação ser de primeiro grau ou não, é possível extraí-los. Pode exportar os contactos para ficheiros CSV/Excel, ATS (software de RH) ou CRM. Não hesite em obter mais informações sobre o SalesQL aqui.

Quais são os parâmetros de aplicação dos métodos automatizados?

Para extrair dados de algumas das ferramentas de extração acima referidas, seria útil saber como definir estes parâmetros:

Fios

Os segmentos são o número de ligações atualmente abertas que está a utilizar para extrair dados do LinkedIn ou de qualquer outro sítio Web. Quanto maior for o número de threads, mais rápido será o processo de recolha de dados. No entanto, o LinkedIn sinalizá-lo-á rapidamente.  

Assim, embora muitos scrapers definam 10 proxies por thread, a melhor opção seria utilizar um thread por proxy. Se for mais do que isso, o LinkedIn desconfiará que poderá acabar em tribunal, embora isso possa abrandar o processo de recolha de dados.

Intervalos

Os tempos limite são a quantidade de tempo que o servidor demora a responder a um proxy antes de o proxy iniciar um novo pedido. Muitos scrapers definem os tempos limite para 1 ou 2 segundos. Assim, os resultados seriam muito mais rápidos. No entanto, não o recomendamos e, consistentemente, é necessário definir os tempos limite para um nível mais elevado, digamos 20-30 segundos. Isto dá ao servidor uma pausa sólida antes de aceitar um novo pedido.

Recolha de perfis privados no LinkedIn

Nesta última secção, descobrirá como extrair um perfil privado. No entanto, a recolha de dados de perfis privados para e-mails e outros detalhes levanta questões legais para o LinkedIn, porque quando cria uma conta no LinkedIn, este promete proteger os seus dados e não os divulgar a terceiros.

Pode recolher os dados de alguém, incluindo endereços de correio eletrónico, para fins não destrutivos. Estes incluem talvez estar à procura de emprego e de redactores técnicos freelance numa determinada cidade. Por outro lado, pode estar a fazer scraping para investigação. Assim, com isso em mente, vamos descobrir como fazer scraping de perfis privados.

Criar contas

A forma ideal de fazer scraping de perfis privados é criar uma conta de utilizador. Assim, poderá ligar-se ao maior número possível de contactos. No entanto, seria útil se tivesse em mente que esta conta não é para estabelecer contactos com pessoas. Em vez disso, deve utilizá-la como ponto de entrada no LinkedIn para efeitos de recolha de dados.

Recomendo a utilização do Octoparse para este efeito. Isto porque permite-lhe iniciar sessão no LinkedIn com a sua conta e aplicar as pesquisas adequadas. Depois, pode fazer scraping com a funcionalidade de arrastar e largar enquanto mostra a página do LinkedIn em que se encontra.

Pesquisa e colheita

Depois de criar a conta e quando estiver pronto para pesquisar com o Octoparse, tem de descobrir o que quer pesquisar. Depois, o Octoparse explora precisamente o que pretende. No entanto, pode recolher apenas a informação disponível como não-conexão, incluindo os endereços de e-mail dos contactos.

Utilizar proxies dedicados

É muito provável que o LinkedIn o bloqueie com o método acima referido se não respeitar as regras de tempo limite e de tópicos.

Além disso, certifique-se de que, quando criar uma conta, utiliza um servidor proxy e o mesmo endereço IP quando fizer scraping através do Octoparse. Isto porque aparece como um ser humano no LinkedIn, uma vez que a maioria dos seres humanos não acede ao LinkedIn a partir de diferentes endereços IP em fracções de segundo. Portanto, se usar um proxy para criar uma conta, use o mesmo proxy quando estiver a fazer scraping do LinkedIn.

Agora é uma questão de saber que proxies utilizar e quantos proxies utilizar.

Que proxies utilizar para o scraping do LinkedIn?

Os proxies ideais para o scraping do LinkedIn são os proxies de elite. Isto deve-se ao facto de os proxies elite proporcionarem um maior anonimato e definições de cabeçalho seguras do que os outros tipos de proxy.

Antes de efetuar scraping, é necessário ter em conta que o LinkedIn não gosta de scraping e trata os culpados com seriedade. Isto implica que tem de utilizar proxies Elite dedicados e proxies Elite privados. Os proxies partilhados ou gratuitos estão simplesmente fora de questão para este efeito.

Número de procurações

O número de proxies depende em grande medida do tamanho do ficheiro que vai extrair. Tal como referido anteriormente, quando se utiliza um único proxy por conta, recomenda-se a utilização de 50 contas e 50 proxies.

Se pretender ter mais proxies por conta, o que não recomendamos, utilize um número entre 100 e 150. Depois, alterne-os com frequência para que o LinkedIn não os apanhe e os proíba.

Por outro lado, se tiver menos proxies, é provável que o LinkedIn os proíba. Por isso, para determinar o melhor valor, deve experimentar o mais possível com o LinkedIn. Isto também o ajudará a identificar se algum dos seus proxies está na lista negra do LinkedIn.

Conclusão

Depois de ler este artigo, esperamos que tenha uma ideia abrangente sobre como pode extrair e-mails através do LinkedIn. A maneira mais fácil e mais óbvia é usar o método manual. No entanto, isso não vai trazer muitos resultados. Por isso, a escolha mais óbvia seria usar uma ferramenta automatizada juntamente com proxies de elite.

Desejamos-lhe boa sorte na extração de e-mails do LinkedIn utilizando os métodos aqui mencionados.