Särskilt vid simulering gäller den gamla sanningen: kvaliteten på resultatet är proportionell mot kvaliteten på inmatningen ("Du får det du beställer."). Det är alltså av största vikt att produktionssimuleringen görs med korrekta och realistiska data. Det gäller såväl det inkommande materialflödet som kapaciteten och parametrarna hos maskiner och utrustning som är med i simuleringen eller till exempel lagerkapacitet och -parametrar, för att inte tala om olika routningar.
I allmänhet är det datainsamlingen som utgör huvuddelen av kundens arbete i ett simuleringsprojekt. Hur mycket arbete och tid som krävs för insamlingen varierar mellan olika projekt. Det finns projekt där indatan är klar på några dagar, men oftast tar det några veckor för all data att samlas in, kombineras och bearbetas.
I bästa fall sköts databehandlingen av en person som kan systemen och verktygen och har förmågan att självständigt producera tämligen färdiga data. Ofta samlas data in från många system och många experter. Om det inte är möjligt att få fram historiska data som lämpar sig för simulering (exempelvis green field-projekt), skapas de på basis av bästa kunskap och erfarenhet.
Mängden data är sällan något problem – det finns det gott om. Men att använda datan är en annan sak. Produktionssimuleringsprojektet kan vara den första "kund" som använder sig av data som samlats in under årens lopp. I det skedet kanske man upptäcker att kvaliteten på datan inte motsvarar vad man trodde. Det kan också komma som en överraskning till exempel att uppgifterna sparas bara en vecka, när en produktionssimulering skulle kräva uppgifter för flera månader.
Simuleringsmodellen förstår inte felaktig information eller ger felaktiga resultat på grund av felaktiga indata. Det kan finnas miljontals rader med data, och då är det inte konstigt att det tar tid att gå igenom dem.
Om informationen har samlats in manuellt måste den nästan undantagslöst rensas. Materialet kan innehålla felaktig information, tomma fält, text i numeriska fält, flera arbetsmoment registrerade med samma tidsstämpel och mycket annat som ställer till problem. Simuleringsmodellen förstår inte felaktig information eller ger felaktiga resultat på grund av felaktiga indata. Det kan finnas miljontals rader med data, och då är det inte konstigt att det tar tid att gå igenom dem. Allt eftersom projektet fortskrider måste man komma överens om ifall de felaktiga uppgifterna ska raderas eller rättas.
Automatiskt insamlade data är regelbundna och formbundna, vilket är till stor hjälp när man börjar använda dem i simuleringsprojektet. Data kan samlas in automatiskt till exempel med verktyg som maskinspårning, produktionsplanering och underhåll.
Det är bra att validera simuleringsmodellen med realiserade historiska data så man kan vara säker på att produktionssimuleringen fungerar som man önskar. När input läses in i modellen från en tabell vet vi exakt vad som kommer och när. Men sådana raddata kan begränsa körningen av olika slags scenarier. Om vi till exempel vill öka produktionen med 10 procent kan det vara svårt att producera ytterligare ett antal rader av rätt slag och vi blir "fångar" i raddatan. I allmänhet lönar det sig att utifrån realiserade data göra en fördelning av till exempel olika råvaror som matas in i modellen, vilket gör det lättare att skala den.
Ofta blir en stor del av datan validerade först under modelleringsfasen. Informationen finns visserligen i rätt format, men när du kör modellen märker du att allt inte stämmer. Det är som synes mycket att tänka på när det gäller datainsamling och analys för simulering. Men det är ett moment som i sig ger användbara resultat. Du kan dra många slutsatser av datan redan innan du får de egentliga simuleringsresultaten och därmed uppstår givande diskussioner och aha-upplevelser mellan olika parter.
Guide in English: Digital twin in the manufacturing industry
Simulering - Det går bra för företag som smidigt kan anpassa sig till förändringar