Hvor lang tid tager et typisk AI-pilotprojekt?

4 til 6 uger fra kontraktstart til pilot i drift, plus 30 dages måleperiode bagefter. Mindre, afgrænsede pilots (én proces, én funktion) kan ofte landes på 3 uger. Større tværgående pilots (RAG-portal, dokument-klassificering på tværs af afdelinger) tager typisk 6 til 8 uger. Hvis nogen sælger jer et pilotprojekt på 4 måneder, så er det ikke længere en pilot. Det er et fuldt implementeringsprojekt der bør prissættes som sådan.

Hvad koster et AI-pilotprojekt for en SMV?

Hos EnterpriseIQ koster en pilot 50.000 til 150.000 kr afhængigt af scope. Den nedre ende dækker simple n8n-flows eller prompt-bibliotek til én konkret arbejdsgang. Den øvre ende dækker custom RAG-portal med kunde-data, eller integration med eksisterende systemer som CRM eller dokument-arkiv. 20 procent af prisen kan kobles til opnåede besparelser i 30-dages måleperioden, så vi deler risikoen.

Hvilken use case skal vi vælge til vores første pilot?

Den use case der scorer højst på tre dimensioner: høj impact (tidsbesparelse eller kvalitetsløft I kan måle), lav til medium effort (kan landes på 4 til 6 uger uden større systemintegrationer) og lav risiko (ingen kundedata med høj følsomhed, ingen automatiserede beslutninger). For advokater: kontrakt-review eller dokument-sammenfatning. For revisorer: materielitets-vurdering eller udkast til revisionsnotater. For IT-service: ticket-prioritering eller intern knowledge base.

Hvordan måler vi ROI på en AI-pilot?

Etablér en baseline INDEN piloten går i drift: hvor mange timer bruger I i dag på den arbejdsgang piloten dækker, hvad er fejlrate eller gennemløbstid. Mål derefter i 30 dage med piloten aktiv. ROI er forskellen i tid eller kvalitet. For konkrete pilots ligger tidsbesparelsen typisk på 30 til 60 procent på selve den arbejdsgang der automatiseres, hvilket netto giver 5 til 15 procent på samlet arbejdstid for de medarbejdere der bruger piloten.

Hvad sker der hvis piloten ikke virker?

Det er hele pointen ved en pilot. Bedre at finde ud af det efter 4 uger og 80.000 kr end efter 6 måneder og 800.000 kr. Vi designer piloten så de tre kritiske antagelser (data-kvalitet, brugervilje, output-kvalitet) testes så tidligt som muligt. Hvis en antagelse falder, dokumenterer vi hvorfor og hvilken alternativ retning der ville være mere lovende. Det er ikke fiasko, det er læring der koster en brøkdel af et fuldt implementeringsprojekt.

Skal vi bruge ChatGPT, Claude eller noget self-hosted i piloten?

Det afhænger af data-følsomhed. For interne arbejdsgange uden kunde-fortrolige data er Claude Team eller Microsoft Copilot for M365 typisk det rette valg. For klient-fortrolige data: Claude Enterprise med EU-residency eller self-hosted Llama 3.3 70B på Proxmox via n8n. Vi anbefaler aldrig forbruger-tier (Claude Pro, ChatGPT Plus) i pilots der rører kunde-data, da inputs kan bruges til træning. Detaljer i vores AI-værktøjer-pillar.

Hvilke medarbejdere skal involveres i piloten?

Tre roller. 1) En sponsor på direktions- eller partner-niveau der ejer beslutningen og kan rydde forhindringer. 2) Én engageret superbruger fra det team der skal bruge piloten. Ikke nødvendigvis den mest tekniske, men den der mest aktivt vil arbejde med løsningen. 3) IT-kontakt der kan sikre adgang til relevante systemer (CRM, dokument-arkiv) og forholde sig til GDPR og adgangskontrol. Tre personer er tilstrækkeligt. Større pilot-teams sænker hastigheden uden at højne kvaliteten.

Hvordan skalerer vi fra pilot til fuld implementering?

Pilot succeskriterier først (ROI dokumenteret, brugere tilfredse, ingen GDPR-flag). Derefter tre veje. 1) Skalér samme pilot til hele teamet (typisk 3 til 6 uger). 2) Tilføj relaterede arbejdsgange under samme stack (såkaldte fast-follow pilots). 3) Konsoliderer flere pilots i en samlet platform med fælles governance. De fleste SMVer kører 2 til 4 pilots parallelt det første år før det giver mening at tale om platform-konsolidering.

Hvordan starter vi konkret i denne uge?

Tre skridt. 1) Tag EnterpriseIQ Score (5 minutter, gratis) for en baseline på jeres AI-modenhed. 2) Hold en 60-minutters use case-prioritering med ledelsen plus 1 til 2 nøglemedarbejdere. Brug pilot canvas fra denne pillar som struktur. 3) Vælg den use case der scorer højst på impact/effort/risk-matricen, og bestil enten en Quick Scan (12 til 18 tkr, 1 dag) eller direkte pilotprojekt (50 til 150 tkr, 4 til 6 uger). Quick Scan er anbefalingen hvis I ikke har fuldt overblik over jeres AI-modenhed endnu.

Hvad bør vi IKKE bruge en AI-pilot på?

Tre typer use cases er forkerte til en pilot. 1) Automatiserede beslutninger om enkelt-personer (HR, kreditvurdering, sagsbehandling med retlig virkning). Det er Art. 22 GDPR og EU AI Act high-risk, kræver fuld implementering med human oversight fra dag et. 2) Mission-critical processer hvor fejl koster mere end pilotens budget. Start på et lavere risiko-niveau først. 3) Use cases hvor I ikke kan formulere én konkret succesmetric. Hvis I ikke kan måle om piloten lykkedes, så gør den ikke.

Pillar · Publiceret 2026-05-26 · 14 min læsetid

AI-pilotprojekter: sådan starter I

Q: Skal piloten dokumenteres for EU AI Act?

Ja, også selvom piloten ikke er en high-risk AI-system. Hver pilot bliver del af jeres AI-system-inventory (uanset risk-niveau), og hvert AI-system har minimum dokumentationskrav: hvilken model bruges, hvilke data sendes ind, hvad er det forretningsmæssige formål, hvem ejer den, hvad er fall-back hvis den fejler. Det tager 1 til 2 timer pr pilot at dokumentere ordentligt, og det letter senere når I står med EU AI Act-audit. Se vores EU AI Act-pillar.

De fleste danske SMVer der vil i gang med AI strander på det samme spørgsmål. Hvor starter vi? Det rigtige svar er sjældent det første der bliver foreslået på direktionsmødet. En struktureret pilot på 4 til 6 uger med klare succeskriterier er den vej der har den højeste sandsynlighed for at lede til en varig AI-praksis. Denne pillar gennemgår hvordan I prioriterer use cases, designer en pilot der faktisk kan måles, og hvordan I undgår de syv typiske faldgruber.

Skrevet af Jesper Sachmann, grundlægger af EnterpriseIQ. Pilotprojekt-erfaring fra Archer-platformen plus aktivt arbejde med n8n agent-flows og custom RAG-løsninger på Proxmox siden 2023.

TL;DR

→En pilot er ikke et nedskaleret implementeringsprojekt. Det er et eksperiment med tre kritiske antagelser: data-kvalitet, brugervilje, output-kvalitet.
→Use case-prioritering på tre akser: impact, effort, risiko. Score 1 til 5 på hver, vælg højeste samlede score.
→Pilot canvas: problem, løsning, data, success metrics, risici, team, timeline. En A4, ikke et 30-siders dokument.
→Mål baseline INDEN piloten starter. ROI dokumenteres på 30 dage med pilot aktiv vs baseline.
→Pris: 50 til 150 tkr, 4 til 6 uger, 20 procent risk-share på opnåede besparelser.

Hvorfor pilot frem for stor satsning

Det ligger nær at tænke at hvis I har besluttet at investere i AI, så skulle I gå direkte til en samlet implementering. Det er forståeligt. Pilot-fasen virker som forsinkelse på det rigtige projekt. Men data fra danske SMVers AI-projekter de seneste tre år viser noget andet. Cirka halvdelen af de samlede AI-investeringer der startede uden pilot-fase landede på under 30 procent af den forventede ROI. Cirka tre fjerdedele af dem der startede med en pilot leverede ROI inden for forventet bånd.

Forskellen er ikke teknologien. Det er de tre antagelser hver AI-implementering bygger på. Antager I at jeres data er strukturerede nok til at AI kan arbejde med dem? Antager I at jeres medarbejdere vil bruge løsningen i deres daglige arbejdsgange? Antager I at AI-outputtet kan opnå den kvalitet jeres kunder forventer? De tre antagelser kan ikke verificeres på direktionsmødet. De skal testes mod virkeligheden.

Det er det en pilot gør. Den koster 50 til 150 tkr og 4 til 6 uger at få konkrete data på de tre antagelser. Hvis alle tre holder, er den efterfølgende fulde implementering markant mere sandsynlig at lykkes. Hvis én eller flere falder, har I sparet en stor investering og lært hvor antagelsen skal omformuleres før næste forsøg.

Use case-prioritering: impact, effort, risiko

Den første reelle beslutning er hvilken use case I piloterer. Det er også der de fleste går i stå, fordi enhver afdeling har 5 til 10 ideer der kunne være lovende, og direktionen mangler en struktur til at vælge mellem dem.

Tre-dimensionel scoring fungerer godt. For hver kandidat-use case, vurder på tre akser med skala 1 til 5:

Impact (1 til 5)

Hvor stor er besparelsen eller kvalitetsløftet hvis AI-løsningen virker som forventet? 1 = marginal forbedring på lille arbejdsgang. 5 = transformerer en kerneproces der bruger 30+ procent af et teams tid.

Eksempel: automatisk klassificering af indkommende kontrakter (impact 4) vs forbedret intern søgemaskine (impact 2 for et lille team, impact 5 for et stort team).

Effort (1 til 5, hvor 1 er lavest)

Hvor svært er det at bygge piloten? 1 = standard prompt-bibliotek eller simpel n8n-flow på eksisterende stack. 5 = custom integration med 3+ systemer, nye data-pipelines, eller training på eget data.

Eksempel: prompt-bibliotek til kontrakt-review (effort 1) vs custom RAG på 50.000 historiske sager (effort 4).

Risiko (1 til 5, hvor 1 er lavest)

Hvor stor er konsekvensen hvis AI-løsningen fejler eller producerer dårligt output? 1 = intern arbejdsgang, fejl er pinlige men reversible. 5 = automatiseret kunde-vendt beslutning med juridisk konsekvens.

Eksempel: udkast til intern mail (risiko 1) vs automatisk kreditscoring (risiko 5, faktisk EU AI Act high-risk).

Samlet score = impact - effort - risiko (jo højere, jo bedre). Den use case der scorer højst er typisk jeres første pilot. Pas på fælden hvor I vælger den mest spændende use case (typisk høj impact men også høj effort eller risiko) som første pilot. Den giver dårligst chance for success. Vælg den der scorer højst på matricen frem for den der lyder mest interessant på direktionsmødet.

Pilot Canvas på én side

Når use casen er valgt, formuleres piloten i et canvas på én A4. Det er ikke et 30-siders dokument. Det er den klare ramme der sikrer alle har samme forventninger.

Use case-navn: [klart, konkret navn]

Problem: Hvilket konkret problem løses? Hvor mange timer eller fejl koster det i dag?

Løsning: Hvilken AI-tilgang anvendes? Hvilken model, hvilken stack?

Data: Hvilke data sendes ind? Hvor følsomme? GDPR-overvejelser?

Success metrics: 2 til 3 målbare mål (tidsbesparelse %, fejlrate, brugertilfredshed). Baseline-værdier.

Tre kritiske antagelser: Hvilke tre antagelser SKAL holde for at piloten lykkes?

Risici: Hvad kan gå galt? Hvad er mitigerings-strategien?

Team: Sponsor (navn), superbruger (navn), IT-kontakt (navn). Max 3 personer.

Timeline: 4 til 6 uger build + 30 dages måleperiode. Mile-plan.

Beslutningspunkt: Efter 30 dage: skalér, omformuler, eller stop?

Et godt pilot canvas tager 60 til 90 minutter at udfylde sammen med ledelsen og superbrugeren. Hvis det tager 4 timer at få igennem, så er use casen sandsynligvis for diffust formuleret. Gå tilbage til prioriterings-matricen og vælg noget mere afgrænset.

30-dages måleframework

Den hyppigste fejl ved AI-pilots er ikke teknologivalg. Det er at piloten startes uden baseline, så ROI ikke kan dokumenteres bagefter. Etablér derfor altid baseline INDEN piloten går i drift.

En måleperiode på 30 dage er det rette niveau. Kortere giver for små datasæt. Længere giver bias fra ferier, kvartalsskift eller andre ydre forhold. Hvad I måler afhænger af use casen, men tre typer metrics er typisk relevante.

Tidsmetrics

Hvor mange minutter eller timer bruger en superbruger på den arbejdsgang piloten dækker? Mål før piloten (baseline) i mindst 5 til 10 cases. Mål efter piloten (30 dage) på minimum 20 cases.

Typisk forventning: 30 til 60 procent tidsbesparelse på den specifikke arbejdsgang.

Kvalitetsmetrics

Hvor mange fejl, omarbejdninger eller kunde-klagemål kommer ud af den arbejdsgang? Sammenlign baseline med piloten.

Vigtigt: AI kan reducere visse fejltyper og introducere nye. Begge tæller. Hold øje med ændret fejlmønster.

Bruger-metrics

Hvor ofte bruger superbrugeren faktisk piloten? Hvor tilfredse er de (NPS-style spørgsmål)? Hvilke friktion-momenter beretter de om?

Vigtigste signal: hvis superbrugeren stopper med at bruge piloten på trods af målbar tidsbesparelse, så er der noget i UX eller tillid der ikke virker. Undersøg det.

Efter 30 dage: tag beslutningen. Tre udfald. 1) Pilot leverer ROI som forventet, skalér til hele teamet. 2) Pilot viser delvis ROI eller én af de tre kritiske antagelser holdt ikke fuldt. Omformuler og kør en justeret pilot i 14 dage. 3) Pilot virker ikke, dokumenter hvorfor, vælg næste use case fra prioriterings-matricen.

Branche-eksempler

Advokatvirksomhed: kontrakt-review-assistent

Use case: AI læser indkomne kontrakter og identificerer afvigelser fra firmaets standard-klausuler plus risiko-flagging. Output er en 1-side-rapport advokaten kan bruge som udgangspunkt for det fulde review.

Score: impact 4 (sparer 30 til 60 min pr kontrakt), effort 2 (prompt-bibliotek plus n8n-flow, ingen integration), risiko 2 (advokat reviewer altid det endelige output).

Stack: Claude Team eller Claude Enterprise med EU-residency, n8n agent-flow på Proxmox, prompt-bibliotek versionsstyret i Git. Typisk pilot-pris: 60 til 90 tkr.

Revisorhus: materielitets-vurdering ved revisionsplanlægning

Use case: AI læser sidste års revisionsdokumentation plus indeværende års saldobalance og foreslår materielitets-tærskler plus indikatorer på arbejdsfelter der bør prioriteres. Revisor reviewer og godkender før den endelige planlægning.

Score: impact 4 (sparer 4 til 8 timer pr revisionssag), effort 3 (kræver struktureret data-input fra Saldobalance-systemet), risiko 3 (FSR-standarder, kræver dokumenteret human review).

Stack: Claude Enterprise (kunde-fortrolige data), Python-script til data-extraction fra revisionssoftware, audit-trail-PDF pr generation. Typisk pilot-pris: 100 til 130 tkr.

Finansrådgivning: kunde-rapport-generering

Use case: AI sammenfatter kundens portfolio-performance plus relevante markedsindsigter til den månedlige eller kvartalsvise kunde-rapport. Rådgiver tilfører den personlige rådgivning og godkender.

Score: impact 5 (rapport-generering er ofte 40 til 60 procent af rådgiverens administration), effort 2 (struktureret data fra portfolio-system, prompt-bibliotek), risiko 3 (kunde-fortrolige finansielle data, GDPR Art. 9 i visse tilfælde).

Stack: Claude Enterprise med DPA, integration med portfolio-system via API, kvalitetstjek-loop med rådgiver-review før udsendelse. Typisk pilot-pris: 80 til 120 tkr.

IT-service-virksomhed: ticket-prioritering plus intern knowledge base

Use case: AI læser indkomne support-tickets og klassificerer dem efter haster-niveau plus foreslår relevante runbooks fra intern knowledge base. Support-medarbejder reviewer prioritering før den eksekveres.

Score: impact 4 (afkorter response-tid med 40 procent), effort 2 (RAG på eksisterende knowledge base, n8n-flow), risiko 2 (intern arbejdsgang, ingen kunde-vendt automatisering).

Stack: Llama 3.3 70B self-hosted på Proxmox (data-suverænitet), Qdrant vector-DB, n8n routing-flow til ticket-system. Typisk pilot-pris: 70 til 110 tkr.

Syv typiske faldgruber

Mønstret går igen i de pilots der ikke landede ROI. Faldgruberne er ikke svære at undgå når man kender dem.

Faldgrube 1: Ingen baseline

Piloten starter uden måling af før-tilstand. Efter 30 dage findes der så ikke konkrete tal at sammenligne med, og ROI bliver en mavefornemmelse. Fix: brug en uge før pilot-start på at måle baseline.

Faldgrube 2: For bredt scope

En pilot der dækker tre afdelinger eller fem arbejdsgange er ikke en pilot. Det er et fuldt projekt forklædt som pilot. Fix: én klar arbejdsgang, ét team, én succesmetric.

Faldgrube 3: Forkert sponsor

Hvis sponsoren er en mellem-leder uden bemyndigelse til at rydde forhindringer (IT-adgang, GDPR-godkendelse, ændring i arbejdsgang), så går piloten i stå på halvvejen. Fix: sponsor på direktions- eller partner-niveau.

Faldgrube 4: Tech-først, problem-andet

Piloten starter med "vi vil bruge Claude" eller "vi vil bygge en RAG-portal" frem for "vi vil løse problem X". Det leder til løsninger der søger et problem. Fix: pilot canvas starter med problemet, teknologi-valget kommer efter.

Faldgrube 5: Ingen superbruger involveret

Hvis piloten bygges uden den medarbejder der faktisk skal bruge løsningen, så ender den med at være teknisk korrekt men ubrugelig i praksis. Fix: superbruger er aktiv del af pilot-teamet fra dag et, ikke modtager af færdig løsning.

Faldgrube 6: GDPR-bekymringer ignoreret indtil drift

Pilot bygges og testes på syntetiske eller anonymiserede data. På dagen før go-live opdages det at de rigtige data er kunde-fortrolige og ikke må sendes til den valgte AI-leverandør. Fix: data-følsomhed afklares i pilot canvas, INDEN bygge-fasen starter.

Faldgrube 7: Ingen beslutningspunkt

Efter 30 dage er ingen ansvarlig for at træffe beslutningen: skalér, omformuler eller stop. Piloten lever videre uden klart formål, optager superbrugerens tid og kannibaliserer momentum til næste use case. Fix: pilot canvas inkluderer eksplicit beslutningspunkt med dato og ejer.

Sådan skalér I fra pilot

Hvis piloten leverer ROI som forventet, kommer det næste spørgsmål. Hvordan går vi fra én superbrugers pilot til hele teamet eller hele organisationen?

Tre veje, typisk i denne rækkefølge:

Vej 1: Same use case, full team (3 til 6 uger)

Pilot går fra én superbruger til hele teamet der bruger samme arbejdsgang. Fokus er træning, dokumentation og fejlrettelser baseret på erfaringer fra de 30 dage. Det er den mest naturlige skalering og typisk hvor 80 procent af pilot-værdien realiseres.

Vej 2: Fast-follow pilots på samme stack

Når én pilot virker på en stack, kan I bygge 2 til 3 relaterede pilots på samme tekniske fundament uden at gentage stack-investeringen. For advokat-firma der landede kontrakt-review-pilot: næste fast-follow kunne være dokument-sammenfatning eller juridisk research-assistent. Hver fast-follow tager 50 til 70 procent af tiden den første pilot tog.

Vej 3: Platform-konsolidering (typisk år 2)

Når I har 3 til 5 pilots i drift, giver det mening at konsolidere dem på en samlet platform med fælles governance, audit-trail, model-management og brugeradgang. Det er ikke noget I planlægger på dag et. Det er noget I gør når platform-fragmentering er begyndt at koste mere end konsoliderings-investeringen.

Bemærk: spring ikke direkte til Vej 3 fra første pilot. Mange SMVer falder for "AI-platform"-narrativet og bygger et infrastruktur-projekt frem for at levere konkret værdi. Den vej fører til IT-projekter der lukker uden produktion. Lev med 2 til 3 separate pilots i et år før platform-spørgsmålet bliver reelt.

Tre skridt I kan tage i denne uge

Skridt 1: Tag EnterpriseIQ Score

5 minutter, gratis. Baseline på AI-modenhed på 6 dimensioner.
Du får tilbagemelding på hvilke dimensioner der ikke er stærke nok til pilot endnu.
Score under 4 i en dimension som "datafundament" eller "governance" betyder at pilot-rejsen typisk starter med at lukke det hul først.

Skridt 2: Hold 60 min use case-prioritering

Direktion plus 1 til 2 nøglemedarbejdere samles til struktureret workshop.
Brainstorm 5 til 10 kandidat-use cases (10 min).
Score hver på impact, effort, risiko (30 min).
Vælg top-2 til pilot-overvejelse (20 min).

Skridt 3: Bestil enten Quick Scan eller pilot direkte

Hvis I er usikre på modenhed: Quick Scan (12 til 18 tkr, 1 dag). Får en 10-siders rapport plus konkret pilot-anbefaling.
Hvis use case og prioritering er klar: gå direkte til pilotprojekt (50 til 150 tkr, 4 til 6 uger).
Booking via /kontakt. Vi melder tilbage indenfor 24 timer på arbejdsdage.

FAQ

Hvor lang tid tager en typisk pilot?

4 til 6 uger build plus 30 dages måleperiode. Mindre, afgrænsede pilots kan landes på 3 uger. Pilots over 8 uger er ikke længere pilots, det er fulde implementeringer.

Hvad koster en pilot?

50 til 150 tkr afhængig af scope. 20 procent kan kobles til opnåede besparelser i 30-dages måleperioden, så vi deler risikoen.

Hvilken use case skal vi vælge?

Den der scorer højst på impact minus effort minus risiko-matricen. Typisk: dokument-sammenfatning, klassificering, intern knowledge base, eller udkast-generering.

Hvad sker hvis piloten ikke virker?

Det er pointen ved en pilot. Vi designer den så de tre kritiske antagelser testes tidligt. Hvis én falder, lærer vi hvorfor og foreslår alternativ retning. Det er ikke fiasko, det er læring.

Skal piloten dokumenteres for EU AI Act?

Ja, også selvom den ikke er high-risk. Hver pilot bliver del af AI-system-inventory med minimum dokumentation. Tager 1 til 2 timer pr pilot.

Hvilke medarbejdere skal involveres?

Tre: sponsor på direktion eller partner-niveau, én engageret superbruger fra team, IT-kontakt. Større pilot-teams sænker hastigheden.

Næste skridt

Tre veje afhængigt af hvor I står:

Gratis

Tag EnterpriseIQ Score

12 spørgsmål, 5 minutter. Baseline på AI-modenhed og hvilke dimensioner skal lukkes før pilot.

50 til 150 tkr

AI Pilotprojekt

4 til 6 uger leverance plus 30 dages måleperiode. 20 procent risk-share på opnåede besparelser.

Gratis

30 min samtale

Uforpligtende. Vi går use case-listen igennem og finder den højeste-score pilot for jer.

Om forfatteren

Jesper Sachmann er grundlægger af EnterpriseIQ. 27 års IT-lederskab fra Oracle, Logica og Capgemini plus 11 års Archer-baggrund som Alliance Director Europe og Integrated Risk Management Lead Nordics, kombineret med hands-on pilot-arbejde på n8n agent-flows og custom RAG-løsninger siden 2023.

AI-attribution: Denne artikel er AI-assisteret produceret med Claude Opus 4.7, menneskelig review af Jesper Sachmann. Se vores AI-transparenspolitik for hvordan vi bruger AI i alle leverancer.

Citerer du denne artikel? "EnterpriseIQ: AI-pilotprojekter for SMVer (2026-05-26)" eller link til enterpriseiq.dk/indsigt/ai-pilotprojekt-smv.