crawlee-js | Apify & Crawlee | Page 9

Efficient css selectors 8 messages

Sep 21, 2023, 12:14 PM PlaywrightCrawler Web-Scraping RequestQueue Data Storage

How to transfer data between playwrightcrawler and cheeriocrawler? 2 messages

Sep 20, 2023, 6:01 PM Data Storage

Ignore previously crawled URLs 2 messages

Sep 20, 2023, 2:16 PM RequestQueue

How to make Puppeteer crawler ignore errors on page? 2 messages

Sep 20, 2023, 1:34 PM PuppeteerCrawler

chromium.launchpersistentcontext with crawlee 4 messages

Sep 20, 2023, 12:21 AM PlaywrightCrawler Web-Scraping

Page.goto never resolves in headful (using XVFB) using `apify/actor-node-puppeteer-chrome` Docker 2 messages

Sep 19, 2023, 9:22 PM PuppeteerCrawler

Throw error that respects maxRequestRetries 4 messages

Sep 19, 2023, 11:39 AM PuppeteerCrawler

Basic Crawlee how do I use my own proxies? 4 messages

Sep 17, 2023, 3:29 PM HttpCrawler

How to run cheerio crawler with Bun? 3 messages

Sep 17, 2023, 2:05 PM Web-Scraping CheerioCrawler

Webscraper.io 2 messages

Sep 16, 2023, 10:43 PM Web-Scraping

Playwright crawler failing when element is not found 3 messages

Sep 14, 2023, 10:45 AM HttpCrawler PlaywrightCrawler Web-Scraping

Multiple queues 2 messages

Sep 13, 2023, 10:11 PM PuppeteerCrawler RequestQueue

How to open multiple browsers? 5 messages

Sep 12, 2023, 5:16 PM PlaywrightCrawler Web-Scraping

TSConfig in Crawlee projects. 17 messages

Sep 12, 2023, 9:30 AM Automation

TypeError [ERR_UNKNOWN_FILE_EXTENSION]: Unknown file extension ".ts" 12 messages

Sep 11, 2023, 8:24 PM PlaywrightCrawler Web-Scraping

Target Closed 3 messages

Sep 11, 2023, 7:52 PM PuppeteerCrawler Web-Scraping

Set debug breakpoint in VS Code 6 messages

Sep 8, 2023, 7:21 AM Web-Scraping

XVFB fails on server. 16 messages

Sep 7, 2023, 11:35 AM Automation PlaywrightCrawler

Anything special about .php websites? 9 messages

Sep 7, 2023, 10:21 AM PlaywrightCrawler RequestQueue

Handle browser failure 2 messages

Sep 7, 2023, 9:45 AM PuppeteerCrawler

Best practices to not crawl links that are already crawled when Actor is run as CRON 2 messages

Sep 5, 2023, 2:07 PM Automation Suggestions Web-Scraping

Stoping Crawler when done in scraping 2 messages

Sep 4, 2023, 3:59 PM Web-Scraping

Code refactoring - reusing a common handler in multiple crawlers while keeping code hints 11 messages

Sep 4, 2023, 4:23 AM PlaywrightCrawler Web-Scraping

Crawler skipping Jobs after processing 5,000-6,000 Requests 7 messages

Sep 3, 2023, 6:23 AM Automation Web-Scraping CheerioCrawler RequestQueue

Crawlee does not work with cron job 6 messages

Sep 3, 2023, 3:28 AM Automation Web-Scraping CheerioCrawler

TikTok scraper following list 2 messages

Sep 1, 2023, 7:17 PM PlaywrightCrawler

Running crawlee multiple times with the same URL 3 messages

Sep 1, 2023, 10:37 AM PuppeteerCrawler RequestQueue

Passing data to a router/ handler 3 messages

Sep 1, 2023, 7:40 AM PlaywrightCrawler Web-Scraping

Crawlee does not work with cron job 3 messages

Aug 31, 2023, 9:09 AM Web-Scraping CheerioCrawler

Re-using the crawler, instead initializing after each url? 2 messages

Aug 29, 2023, 8:51 AM Automation Web-Scraping CheerioCrawler RequestQueue

'BrowserPool: Page crashed' errors after updating packages 2 messages

Aug 28, 2023, 12:09 AM Automation PuppeteerCrawler

I want to use a created dataset 3 messages

Aug 25, 2023, 9:14 PM Suggestions

JSDOMCrawler, website breaks crawlee 2 messages

Aug 24, 2023, 8:28 PM HttpCrawler Web-Scraping

High Volume Scraping 2 messages

Aug 23, 2023, 7:03 AM Web-Scraping

enqueuelinks doesn't work. 67 messages

Aug 23, 2023, 6:45 AM PlaywrightCrawler RequestQueue

Proxy authentication bug? 5 messages

Aug 20, 2023, 5:20 PM PuppeteerCrawler Web-Scraping

Memory is critically overloaded. Using 12184 MB of 3883 MB (314%). Consider increasing available mem 30 messages

Aug 20, 2023, 9:56 AM PlaywrightCrawler

got many 429 status code when crawled the target site,even though proxies. How to optimise my code? 2 messages

Aug 19, 2023, 3:50 PM PlaywrightCrawler

Download Delay 5 messages

Aug 18, 2023, 2:07 AM Web-Scraping

Log Proxy IP 2 messages

Aug 15, 2023, 10:20 AM PlaywrightCrawler Web-Scraping

Error: Failed to launch the browser process with Puppeter 6 messages

Aug 13, 2023, 1:52 PM PuppeteerCrawler

How to set different requestHandlerTimeoutSecs for specific handlers? 4 messages

Aug 10, 2023, 11:04 PM PuppeteerCrawler

Best practice to stop/crash the actor/crawler on high ratio of errors? 3 messages

Aug 9, 2023, 8:28 PM Web-Scraping

How does createSessionFunction create session when parallel requests are being made 2 messages

Aug 3, 2023, 11:28 PM Automation PuppeteerCrawler Web-Scraping Suggestions

my actor works fine locally but seems to get stuck on initializing crawler, doesn't enter routers 9 messages

Aug 3, 2023, 10:19 AM PlaywrightCrawler

Request queue with id Error 2 messages

Aug 2, 2023, 1:48 PM PuppeteerCrawler RequestQueue

How would I build a crawler that accepts API requests to submit forms for a user? 9 messages

Aug 1, 2023, 6:10 PM Automation

WARN CheerioCrawler: Reclaiming failed request back to the list or queue. Detected a session error, 10 messages

Aug 1, 2023, 9:22 AM CheerioCrawler

Why the CPU utilization rate of crawlee is going down and seem like stop processing any requests 3 messages

Jul 31, 2023, 5:57 PM PuppeteerCrawler Web-Scraping

saving data in apify actor and cleaning 6 messages

Jul 29, 2023, 2:21 AM PlaywrightCrawler Web-Scraping Data Storage