Pre AI laby, agentov a integrátorov
Licencovanie ORSF dát
ORSF je jediný otvorený REST API + MCP server pokrývajúci 1.26M slovenských firiem a 3.78M finančných výkazov. Pre AI laby (OpenAI, Anthropic, Mistral, Perplexity), agent platformy a B2B integrátorov ponúkame tri licenčné úrovne: citácia, inferencia a tréning.
Kontaktovať [email protected] →AI crawler traffic (12. máj 2026)
Cloudflare AI Crawl Control snapshot
ClaudeBot
384.67k
Anthropic · 83 %
Amazonbot
39.08k
Amazon · 8 %
Googlebot
4.96k
Google · 1 %
OAI-SearchBot
1.61k
OpenAI · <1 %
Others (+6)
1.95k
Mixed · <1 %
Citation (zdarma, CC-BY 4.0)
Free citácie + ChatGPT / Claude / Perplexity browse fetche. Uveď ORSF + link na kanonickú /company/{ico} URL. Žiadny bulk download, žiadne tréningové použitie.
- Verejné REST API (60 req/min)
- OpenAPI 3.1 spec
- JSON / HTML scraping
- Citation footer požadovaný
€0
Inference (od €2 000/mes)
Dedikovaná šírka pásma + rate-limity pre AI inferenciu (claude.ai, ChatGPT browse, Perplexity citácie). Súčasťou SLA, webhooky pre fresh updates, prioritný queue.
- Až 1M req/deň
- Webhook stream nových firiem
- Priority crawl queue
- Dedikovaný support kanál
- 99.5% SLA
€2 000+ / mo
Training (bulk license, contact)
Plný PostgreSQL dump + kvartálny refresh + Parquet exporty pre tréningový korpus. Non-exclusive aj exclusive licencie. Podpísaná zmluva + GDPR DPA.
- Plný DB dump (≈4 GB compressed)
- Parquet exports (companies, filings, roles)
- Kvartálne refresh feeds
- Indemnification voľba
- Co-marketing po dohode
na vyžiadanie
Prečo licencovaný dataset, nie scraping?
Po Reddit-v-Anthropic žalobe (jún 2025) je legálne neisté trénovať modely na scraped third-party dátach bez licencie. ORSF ponúka clean source: verejne zo zákona, dokumentované zdroje (source + fetched_at na každom datapointe), audit log s tamper-evident hash chain. EU hosting (Hetzner, Nemecko), GDPR čl. 6(1)(e+f), tombstone pattern pre erasure.
Distribučné formáty
- REST API
- https://api.orsf.sk/v1 — OpenAPI 3.1 verejná spec
- MCP server
- @orsf/mcp-server (npm) — Claude Desktop, Cursor, Zed
- CLI
- @orsf/cli (npm) — orsf company 55609830
- Bulk PostgreSQL dump
- Mesačný snapshot, ≈4 GB compressed, full schema
- Parquet exports
- companies.parquet, filings.parquet, roles.parquet — AI training optimised
- CSV exports
- Per-search, pre BI / analytics použitie
Cloudflare Pay Per Crawl
ORSF je zapojené v Cloudflare Pay Per Crawl private beta. Po aktivácii budú AI crawlery dostávať HTTP 402 s pricing payloadom — Cloudflare bude Merchant of Record.