Läs artiklar bakom betalväggar genom att maskeras som Googlebot

Kategori: Internet

Prova Vårt Instrument För Att Eliminera Problem

Välj Operativsystemet Välj Ett Projektprogram (Valfritt)

Beskriv Ditt Problem

Internet är vid en tipppunkt. Den fortsatta ökningen av adblocking har slutat intäktsmodellen som enbart bygger på annonsdollar för att driva webbplatser och företag.

Särskilt nyhetssajter har börjat experimentera med sätt att diversifiera inkomstkällor, och ett framstående alternativ som webbplatser som The Wall Street Journal, Financial Times, The New York Times, tiderna , eller Washington Post har implementerat eller testat är betalväggssystemet.

Det finns olika typer av betalväggar men de har alla gemensamt att de blockerar åtkomst till innehåll; detta kan hända direkt när den första artikeln öppnas, efter att ett visst antal artiklar har lästs på webbplatsen, eller som ett utdragssystem som visar det första stycket för läsaren och nedan för den registreringsinformation för att läsa resten.

Paywalls kanske inte alltid kräver att användare betalar pengar för åtkomst. Vissa webbplatser kan kräva att användare registrerar sig för att använda webbplatsen men laddar inte användare när de har registrerat sig.

news site paywall

Det kan vara vettigt ur ett affärsmässigt perspektiv och kan vara mer lukrativt än att kämpa ut det med användare som driver adblockers, men det finns en nackdel med det både för den betalväggswebbplatsen och den blockerade användaren.

Webbplatser förlorar en hög andel besökare om de implementerar ett betalväggssystem. Det är oklart hur hög procentandelen egentligen är, och den varierar förmodligen från plats till webbplats, men det är troligt mycket högre än andelen besökare som prenumererar på webbplatsen efter att ha fått valet att prenumerera för att läsa önskad artikel.

För användare kan det vara riktigt frustrerande att följa en länk till en intressant klingande artikel bara för att blockeras från att läsa den när resursen har laddats; det är slöseri med tid för många, särskilt om inget innehåll tillhandahålls innan du registrerar dig eller prenumererar.

Maskerad din webbläsare

Det är ingen hemlighet att nyhetssajter tillåter åtkomst till nyhetsaggregatorer och sökmotorer. Om du till exempel kontrollerar Google Nyheter eller Sök, hittar du artiklar från webbplatser med betalväggar listade där.

Tidigare tillät nyhetssajter åtkomst till besökare som kommer från stora nyhetsaggregat som Reddit, Digg eller Slashdot, men den praxis verkar vara lika bra som död idag. Vissa kan fortfarande tillåta det, men det är rättegång och fel, och lösningen kan stängas av när som helst.

Ett annat knep, att klistra in artikelrubriken i en sökmotor för att läsa den cachelagrade berättelsen direkt på den verkar inte fungera ordentligt längre, liksom artiklar på webbplatser med betalväggar vanligtvis inte längre cachas.

Tips: kolla in följande tillägg som du kan använda för att kringgå betalväggar:

Anti-betalvägg för Firefox och Chrome .

Användaragent och referent

Du undrar förmodligen hur webbplatser blockerar eller tillåter åtkomst till webbplatsens innehåll. Metoderna har förbättrats under åren och det räcker inte längre med att bara ändra webbläsarens referens till https://www.google.com/ för att få full tillgång till en webbplatsens innehåll.

Istället använder webbplatser olika kontroller som innehåller användaragent, referent och kakor, och ibland till och med mer än så, för att bestämma åtkomstens legitimitet.

Allmän information

Det bästa sättet att maskera webbläsaren är förmodligen att göra det verkar vara Googlebot.

Hänvisare: https://www.google.com/
Användaragent: Mozilla / 5.0 (kompatibel; Googlebot / 2.1; + http: //www.google.com/bot.html

Observera att alternativet inte fungerar längre på maj-webbplatser. Det kan vara bättre att försöka maskera sig som kommer från Twitter eller andra sociala mediesajter.

Firefox

referrer

Firefox-användare behöver två webbläsartillägg för det: det första, RefControl, för att ändra referensvärdet när de besöker nyhetssajter, den andra, Användaragentväxlare , för att ändra användaragenten i webbläsaren.

Uppdatering : RefControl är inte längre tillgängligt. Du får Prova detta alternativ istället. Slutet

Ladda ner och installera båda tilläggarna i Firefox webbläsare.
Klicka på Alt-knappen och välj Verktyg> RefControl-alternativ.
Klicka på 'lägg till webbplats', ange ett domännamn under webbplatsen, välj anpassad åtgärd och ange https://www.google.com/ som referens.
Upprepa detta för alla nyhetssidor som du vill ha åtkomst till (vissa kanske inte fungerar även om du gör ändringarna, så tänk på det).
När du är klar stänger du konfigurationsfönstret.
Klicka på Alt-knappen igen och välj Verktyg> Standardanvändaragent> Redigera användaragenter från menyn.
Välj Ny> Användaragent och ersätt strängen i fältet Användaragent med Mozilla / 5.0 (kompatibel; Googlebot / 2.1; + http: //www.google.com/bot.html). Namnge det Googlebot.
Lämna menyn.
Innan du öppnar dessa webbplatser klickar du på Alt och väljer Standardanvändaragent> Googlebot.

Det här är allt. Det är lite olyckligt att det inte finns någon förlängning för Firefox som ändrar användaragenten automatiskt baserat på de webbplatser du besöker.

Google Chrome

Google Chrome-användare kan installera tillägg som Användaragentväxlare och Referenskontroll som är tillgängliga för webbläsaren att göra samma sak.

Det finns dock en annan möjlighet, och det är att skapa ett anpassat tillägg som automatiserar processen i webbläsaren.

Instruktioner finns på Elaineou . Allt som krävs är i princip att skapa en ny katalog på den lokala datorn, skapa de två filerna background.js och manifest.json inuti den och kopiera och klistra in koden som finns på webbplatsen i filerna.

Du måste aktivera 'utvecklarläge' på chrome: // extensions /, och kan sedan välja 'load unpacked extension' för att välja mappen du har skapat de två filerna i för att ladda tillägget i Chrome.

Du kan ändra listan med webbplatser som den stöder för att lägga till nya.