Kode der ikke ville køre mere
En dansk fagforening har et online analyseværktøj hvor medlemmer kan sammenligne deres vilkår med markedet. Under motorhjelmen kører 255 statistiske regressioner — kvantilregression, logistisk regression på personalegoder, og multinomial regression på klausuler.
Problemet var at koden var skrevet i R, var svær at vedligeholde, og efterhånden ikke kørte mere. Konsulenten der vedligeholdt den havde brug for at nogen tog den gamle kode og fik den til at fungere igen.
Hvad Brokk & Sindre byggede
Jeg migrerede hele kodebasen fra R til Python. Ikke en linje-for-linje oversættelse, men en refaktorering der udnyttede hvad Python er god til.
Tech stack
- pandas til datahåndtering og Excel-import
- statsmodels til kvantilregression og binomial GLM
- scikit-learn til multinomial logistisk regression
- joblib til parallel beregning på alle CPU-kerner
Jeg byggede det så en ikke-teknisk medarbejder kan køre det: ét script installerer alt, et andet kører beregningen. Inputfiler detekteres automatisk, og outputtet er CSV-filer der importeres direkte i analyseværktøjet.
Hvad det viser
Det her er et klassisk moderniseringsprojekt. Gammel kode der virker — indtil den ikke gør. Ingen turde røre den, og ingen kunne fejlsøge den. Nu kører den fejlfrit, den er nem at vedligeholde, og den kan bruges år efter år med nye data.