Data Extraction

667

AI tools in the Data Extraction category

All (667)MCP Servers (77)Skills (560)Agents (30)

node-html-crawler

safonovpro

Crawler (spider) of site web pages by domain name

SkillData Extraction

361 dir

n8n-nodes-evomi

evomi

n8n community node for Evomi Scraper API - Web scraping with intelligent mode selection

SkillData Extraction

1 dir

@stellarbeat/js-stellar-node-crawler

pieterjan84

Crawl the network for nodes

SkillData Extraction

131 dir

reviewbr-mcp

vic3m

MCP Server for Brazilian Academic Repositories (OAI-PMH, DSpace REST, HTML scraping) and PRISMA Systematic Reviews

MCP ServerData Extraction

1 dir

json-web-crawler

knovour

Crawl website by json

SkillData Extraction

171 dir

evomi-client

evomi

JavaScript client for Evomi API

SkillData Extraction

1 dir

@hmb-research/x-ray-crawler

tsopic

x-ray's crawler

SkillData Extraction

1 dir

@askjo/camofox-browser

askjo

Headless browser automation server and OpenClaw plugin for AI agents - anti-detection, element refs, and session isolation

...more

AgentData Extraction

8591 dir

nest-crawler

saltyshiomix

An easiest crawling and scraping module for NestJS

SkillData Extraction

661 dir

@aduptive/instagram-scraper

aduptive

Modern TypeScript library for collecting public Instagram content with smart delays, mobile-first approach, and media support

...more

SkillData Extraction

111 dir

trawl-4

tudorilisoi

A full-fledged node.js web crawler with a MySQL backend

SkillData Extraction

1 dir

ayakashi

zisismaras

The next generation web scraping framework

SkillData Extraction

2171 dir

fb-assistant-ts

toshiodev

a facebook puppeteer manipulate library

SkillData Extraction

1 dir

web-structure

kilicmu

A powerful and flexible web scraping library with concurrent processing and DOM hierarchy awareness

SkillData Extraction

1 dir

ai-search-indexer

cruonit

Website content indexer using Mozilla Readability and Playwright

SkillData Extraction

1 dir

rebrowser-patches

nwebson

Collection of patches for puppeteer and playwright to avoid automation detection and leaks. Helps to avoid Cloudflare and DataDome CAPTCHA pages. Easy to patch/unpatch, can be enabled/disabled on demand.

...more

SkillData Extraction

1.3K1 dir

mcp-web-scrape

mukul975

Clean, cached web content for agents—Markdown + citations

MCP ServerData Extraction

41 dir

unsurf

acoyfellow

Turn any website into a typed API

SkillData Extraction

81 dir

sl-dbmaria

putraadtya26

A powerful web scraping tool for everything

SkillData Extraction

1 dir

@screenshotbuddy/node-curl-impersonate

screenshotbuddy

A wrapper around cURL-impersonate, a binary which can be used to bypass TLS fingerprinting.

SkillData Extraction

11 dir