Auf der Jagd nach Steuersündern und Abgabenbetrug: Die Finanz konnte mithilfe von KI und Predictive Analytics Methoden das Volumen der Steuerrückforderungen deutlich erhöhen.
©iStockphotoDurch Steuerhinterziehung entgehen dem Staat Österreich jährlich Einnahmen von rund 13 Milliarden Euro. Mit neuen KI-Technologien versuchen das Finanzministerium und das Bundesrechenzentrum, Lücken zu schließen und die Jagd auf Steuersünder zu vereinfachen und effizienter zu gestalten.
Bei Steuerbetrug oder Abgabenhinterziehung kennt der Staat keine Gnade. Für die vermeintlichen Kavaliersdelikte sind im Finanzstrafgesetz (FinStrG) daher auch mitunter empfindlich hohe Strafen festgesetzt. Gegen Steuersünder können den Bestimmungen zufolge nicht nur Geldstrafen bis zum Doppelten des hinterzogenen Steuerbetrages, sondern auch Freiheitsstrafen verhängt werden. Zudem können Produkte, Waren oder Hilfsgüter auch beschlagnahmt werden, wenn diese etwa im Rahmen von Zollstrafverfahren für andere Finanzvergehen verwendet wurden.
Der Strafrahmen reicht dabei hin zu Freiheitsstrafen von bis zu 10 Jahren, die für besonders schwere Fälle – Abgabenbetrug über 500.000 € laut § 39 FinStrG oder grenzüberschreitenden Umsatzsteuerbetrug § 40 FinStrG – drohen.
Das Bundesministerium für Finanzen (BMF) kooperiert bei der Berechnung der Steuerschulden und der Jagd auf Steuersünder mit dem Bundesrechenzentrum (BRZ) und bringt dafür auch neue KI-Technologien zum Einsatz, die bei Unregelmäßigkeiten Alarm schlagen und mögliche Fälle von Steuerbetrug anzeigen.
"Unsere Systeme lernen laufend dazu"
Roland Ledinger, Geschäftsführer des Bundesrechenzentrums, und Christian Weinzinger, Leiter des Predictive Analytics Competence Centers (PACC) im Finanzministerium, im Interview über die KI-gestützte Jagd auf Steuersünder.
Herr Ledinger, das Bundesrechenzentrum BRZ ist der wichtigste IT-Partner des Public Sektors in Österreich. Es ist dabei unter anderem auch für die Abgaben- und Steuerberechnung des Finanzministeriums zuständig.
Richtig, wir sind der technische Dienstleister für das Bundesministerium für Finanzen. Wir stellen die Infrastruktur zur Verfügung und bauen die technischen Rahmenbedingungen auf. Auch um Steuerbetrug zu erkennen.
Dafür wurden auch Artificial-Intelligence-Anwendungen entwickelt. Wie kommt die Künstliche Intelligenz bei der Jagd nach Steuersündern zum Einsatz?
Wir sprechen in dem Zusammenhang eher von Predictive Analytics. Dieser Begriff beschreibt besser, was wir tun als der Überbegriff "KI". Es handelt sich um vorausschauende Analyse mit der Methodik des Machine Learnings.
Was geschieht dabei?
Wir versuchen im Endeffekt, über Machine Learning bzw. Predictive Analytics jene Fälle von Unternehmen und Privatpersonen zu finden, wo irgendetwas auffällig ist. Wir haben das System bereits produktiv im Einsatz, und es lernt laufend dazu. Mit jedem neuen Projekt werden auch neue Themen angegangen und bearbeitet.
Wie kann man sich das vorstellen?
Die fachliche Kompetenz liegt im Predictive Analytics Competence Centers (PACC) des Finanzministeriums, das Herr Weinzinger leitet. Wir sind der technische Partner, stellen dafür die Infrastruktur zur Verfügung und wickeln die Datenbereitstellung und Datenanalysen ab.
Im Grunde widmen wir uns drei Haupt-Themenbereichen. Das erste ist die sogenannte risikobasierte Fallauswahl, also sprich eine Ex-Post-Prüfung, eine Auswahl von beispielsweise unplausiblen Fällen für eine Betriebsprüfung oder für eine Prüfung der Lohnabgaben bzw. eine Zoll-Betriebsprüfung. Diese Prüfungen können erst durchgeführt werden, wenn bereits eine Steuererklärung eingegangen ist und auch der Bescheid erlassen wurde. Im Nachhinein wird dann nach unplausiblen Sachverhalten gesucht.
Der zweite Bereich ist das sogenannte Echtzeit-Scoring. Dabei werden Fälle in dem Zeitpunkt, zu dem sie im System digital entstehen – zum Beispiel, wenn jemand über Finanzonline seine Steuererklärung einreicht und auf „Absenden“ klickt – auf ihre Plausibilität überprüft.
Beim dritten Bereich, der Betrugsbekämpfung bzw. Prävention, geht es darum, neue Muster zu finden. Einen Schaden möglichst erst gar nicht entstehen zu lassen oder so gering wie möglich zu halten. Zum Beispiel im Bereich des Umsatzsteuerkarussellbetrugs.
Die Ex-Post-Prüfung ist dabei vermutlich noch das Einfachste?
Das „Einfachste“, aber unter Anführungszeichen. Wir können nicht 100 % der Fälle prüfen. Die Technik muss uns dabei unterstützen. Das Wichtigste für uns sind Daten, unterschiedlichste Daten. Aus der Steuererklärung, Bescheiden, Betriebsprüfungen, teilweise auch aus externen Registern wie dem Gewerberegister oder dem Firmenbuch. Diese Daten werden dann benutzt, um unsere Modelle zu trainieren. Wir sprechen dabei von Supervised-Machine-Learning. Dabei ist es wesentlich, dass man zum Antrainieren der Modelle die Ergebnisse kennt. Hier kommt auch das Bundesrechenzentrum ins Spiel. Datenhaltung, Datenaufbereitung, Infrastrukturbereitstellung usw. erfolgt dann im BRZ.
Als Rechenzentrumspartner versuchen wir bei den Tools, die wir einsetzen, sehr stark auf Open Source Tools zu gehen, auch um Abhängigkeiten von Lieferanten so gut es geht zu minimieren. Aber wir verwenden natürlich auch kommerzielle Software. Wir stellen dem Finanzministerium diese Infrastruktur bereit, um dann die gemeinsam erarbeiteten Modelle zu trainieren. Hier versuchen wir, mit mathematisch-statistischen Methoden Muster zu erkennen, die dann zu Einordnungen führen und mit einer Wahrscheinlichkeit bewertet werden.
Die aufbereiteten Daten werden dann von den Data-Scientists im BMF den trainierten Modellen zur Verfügung gestellt. Das bewertete Ergebnis geht anschließen an den Fachbereich, Betriebsprüfer, Steuer- und Zollexperten zur weiteren Verwendung. Im Kompetenzzentrum des Finanzministeriums wird die Expertise aufgebaut, um mit diesen Datenlagen auch in eine vernünftige Auswertbarkeit zu kommen.
Wie viele Personen arbeiten ungefähr im PACC-Kompetenzzentrum des Finanzministeriums?
Bei uns sind es an die 50. Die Hälfte davon im Bereich Data Science, Programmierung und Entwicklung, die andere Hälfte im Bereich Fachexpertinnen und Fachexperten für Steuer und Zoll.
Aus welchem Zeitraum werden dabei Daten untersucht?
Es kommt immer ein bisschen auf das Projekt an, aber im Schnitt greifen wir auf Daten der letzten zehn Jahre zurück. Wir haben aber natürlich nicht Zugriff auf sämtliche Daten, die verfügbar wären. Wir brauchen für jeden Datenpool, den wir verarbeiten eine rechtliche Grundlage, sonst sind die Daten für uns tabu und dürfen nicht verarbeitet werden.
Diese Daten sind auch nicht personen- oder unternehmensbezogen, sondern anonymisiert in den Modellen. Für die Lernmodelle brauche ich nicht den Herrn Meier und den Herrn Huber. Es geht nur um den Fall. Welche Person bzw. welches Unternehmen dahintersteht, ist irrelevant. Es wird, wie auch bei allen anderen Datenbeständen, hohes Augenmaß auf die Anonymisierung und Wahrung der Privatsphäre gelegt. Man kann sich das so vorstellen, dass Nummern vergeben werden, die nicht mehr auf die Personen rückschließen lassen. Es ist auch nicht notwendig, dass aus der Vergangenheit Fälle zugeordnet werden.
Mit den Modellrechnungen erfolgt eine Risikobewertung. Dabei wird eine Wahrscheinlichkeit ausgegeben, mit der ein Antrag unter ein gewisses Muster fällt. Sie werden vielleicht auch schon einmal eine Aufforderung vom BMF bekommen haben, diese und jene Belege nachzuweisen. Das ist dann der Ausfluss aus dieser Wahrscheinlichkeitsberechnung.
Steuererklärungen scheinen dabei noch ein einfacherer Use-Case zu sein. Umsatzsteuerkarussellbetrug ist dagegen hochkomplex und erfordert noch mehr Brainpower und auch Programmierarbeit, um ihn überhaupt einmal erkennen zu können.
Beim Umsatzsteuerkarussellbetrug sind stark die Fachexperten auf der Steuerseite gefragt, um Muster und unplausible Muster zu finden. Im Grunde genommen werden dabei die gleiche Methodik und dieselben Algorithmen genutzt. Zusätzlich gibt es die Schwierigkeit, dass man auch ins Ausland schauen und von dort auch die entsprechenden Daten zur Verfügung haben muss.
Wie vernetzt sind die europäischen oder internationalen Finanzbehörden und Rechenzentren denn diesbezüglich schon?
Es gibt über die Vereinigung europäischer IT Service Provider im öffentlichen Verwaltungsbereich einen regen Austausch über Erfahrungen, was wir tun und wie gewisse Dinge umgesetzt werden. Die Rechenzentren selbst sind nur dann vernetzt, wenn es die fachliche Anforderung gibt, dass wir Daten austauschen und bereitstellen. Aber per se gibt es hier keinen Datenaustausch. Wir versuchen uns nur auch im Sinne von Umsetzung von Künstlicher Intelligenz oder Cloud Computing gut auszutauschen und zu standardisieren.
Unser Ziel ist, dass wir Cloud-ready entwickeln und damit die Möglichkeit haben, uns zwischen den Rechenzentren, auszutauschen oder auch Lösungen durchgängig betreiben können. Aber das passiert nur sehr punktuell und hängt eher von der fachlichen Thematik ab und weniger von der technischen Möglichkeit.
Im einfachen Bereich kann man da sicher Anwendungen gut austauschen, aber konkret hängt das sehr von der Datenlage und nicht zuletzt von der gesetzlichen Grundlage ab, die immer über allem schwebt. Wenn sie nicht vorhanden ist, dann sind uns die Hände gebunden.
Welcher Prozentsatz von möglichen Steuersündern kann den mithilfe der technischen Lösung heute schon herausgefiltert werden?
Das kann man so nicht beantworten, denn man kann auch nicht mit hundertprozentiger Sicherheit sagen, dass ein Betrug vorliegt¸ wenn ein Fall aus dem System als unplausibel herausspringt. Das muss immer noch ein Prüfer oder eine Prüferin feststellen.
Das heißt, die KI ersetzt den Menschen nicht, Predictive Analytics wird nur als Hilfsmittel genutzt, um auf einen Verdacht hinzuweisen?
Genau. Ich beschreibe es immer als Entscheidungsfindungssystem. Es ist definitiv nicht so, dass die KI oder das Predictive-Analytics-System irgendetwas selbst entscheidet. Das Handeln danach passiert immer durch einen Menschen, der sich anschaut und beurteilt, warum das System angeschlagen hat: Ist hier tatsächlich etwas unplausibel, muss man vielleicht nachfragen. Es kann aber auch sein, dass es in Ordnung ist und keine weiteren Handlungen mehr von Nöten sind.
Das heißt, das ist nicht so, dass man eine Steuererklärung eingibt und dann schaut eine KI drauf und dann schlägt sie Alarm und die Finanzpolizei steht vor der Tür.
Das wäre sehr, sehr verkürzt. Aber beim Einsatz von Künstlicher Intelligenz oder Predictive Analytics ist die Verwaltung immer gefordert, den vorgegebenen Rahmen einzuhalten. Das macht auch die Nutzung der Daten oft nicht so einfach. Außerdem verändert sich die Rechtsgrundlage laufend. Vor 20 Jahren war sie ganz anders als heute. Die Lernmodelle müssen auch auf diese veränderten Situationen eingehen. Deshalb ist es wichtig, dass man die Technologie als Mittel zur Qualitätssteigerung sieht, zur Wahrscheinlichkeitsberechnung und Risikoeinordnung. Nicht, um Automatismen auszulösen, die zu konkreten Entscheidungen führen. Das ist ein wichtiger Unterschied zwischen der Verwaltung und dem privaten Sektor. Die Verwaltung hat einen anderen Rahmen. Letztlich soll der Mensch die Entscheidung treffen. Wir benötigen das Wissen und die Skills, Ergebnisse zu interpretieren. Das ist bei einem Google-Suchergebnis genauso der Fall wie bei ChatGPT. Viele glauben, das ist die Antwort auf alles. Nein, das ist es nicht.
Die Antwort auf alles wäre 42 laut „Per Anhalter durch die Galaxis.“
Ich muss das nochmals bekräftigen oder bestärken: Die Leute müssen mit dem Ergebnis umgehen können und wissen, wie sie das zu interpretieren haben. Und in der öffentlichen Verwaltung ist es wirklich essenziell, dass die Entscheidung hoheitlich durch einen Menschen passiert und das, was wir machen, sozusagen für die Entscheidungsfindung oder als Entscheidungsunterstützung herangezogen wird, aber nicht selbstständig irgendetwas auslöst.
Können Sie sich eine Zukunft vorstellen, in der dieser Prozess dennoch einmal rein computergesteuert abläuft?
Aus heutiger Sicht würde ich das ausschließen. Was ich mir aber – abgesehen von der rechtlichen Frage – vorstellen kann, ist, dass es zu einer Freigabe der „Grünfälle“ kommt. Also den Fällen, die in Ordnung sind. Auf die Fälle, die unplausibel erscheinen, wird aber auch in 20 Jahren noch ein Mensch draufschauen müssen.
Es muss natürlich den entsprechenden Rahmen dafür geben. Wie auch für einen innereuropäischen Datenaustausch, um zum Beispiel den angesprochenen Umsatzsteuerkartellbetrug effizienter zu bekämpfen. Halten Sie eine solche staatenübergreifende Zusammenarbeit in Zukunft für realistisch?
Dafür müsste die Grundlage geschaffen werden. Etwa dass, EU-weit oder in den allen EU-Mitgliedsstaaten Daten auf Transaktionsbasis vorhanden wären, es einen EU-Standard dafür gibt. Das ist ein sehr komplexes Thema. Es gibt in einigen Ländern Bemühungen in diese Richtung.
Die Frage ist aber immer, wie man unter Anführungszeichen in Realtime die Transaktionsdaten Steuerergebnisse bekommt und so auch die Information, wer wie viel Steuern bezahlt. Es gibt genug genügend Austauschprogramme. Es ist nicht so, dass die Verwaltungen nicht kooperieren. Es geht darum, dass man immer auf die aktuellen Bewegungsdaten Zugriff hat. Hier wird Predictive Analytics relevant, weil dort kann man eingreifen. In diesen Live-Übertragungen ist – um es vorsichtig zu sagen - Luft nach oben. Das Ganze erfordert aber auch eine wahnsinnige Infrastruktur.
Was mich zurück zum BRZ und zum Thema Datenschutz bringt: Wie schützt sich das Bundesrechenzentrum gegen Cyberattacken?
Wir müssen auch hier immer am letzten Stand der Technik sein. Natürlich haben die Cyberattacken in Krisenzeiten zugenommen. Sie erfolgen auch immer stärker durch Automatisierung oder Crowdsourcing. So wie jedes große Rechenzentrum haben wir ein Computer-Emergency-Response-Team.
Zur Person
Steckbrief
Roland Ledinger
Roland Ledinger ist seit November 2021 Geschäftsführer für Kundenmanagement, Betrieb, Entwicklung und IT-Konsolidierung in der Bundesrechenzentrum GmbH (BRZ GmbH). Der IT-Experte verfügt über eine mehr als 35-jährige Erfahrung in der österreichischen Verwaltung und war zuvor unter anderem Leiter der Gruppe E-Government und Digitalisierung im Bundesministerium für Digitalisierung und Wirtschaftsstandort und Digitalisierungsbeauftragter im Burgenland.
Steckbrief
Christian Weinzinger
Christian Weinzinger ist Leiter des Predictive Analytics Competence Centers (PACC) im Finanzministerium (BMF). Er studierte Wirtschaftsinformatik an der Johannes Kepler Universität Linz und war vor der Zeit beim BMF bei einem großen internationalen Wirtschaftsprüfungs- und Unternehmensberatungsunternehmen für Data & Analytics und Wirtschaftsforensik zuständig.
Das Predictive Analytics Competence Center PACC des Finanzministeriums
Das Predictive Analytics Competence Center PACC wurde eingerichtet, um die Effizienz des Finanzministeriums hinsichtlich Risikomanagement und Effizienzsteigerung bei der Prüfung, Abgabeneinhebung und Betrugsbekämpfung zu verbessern.
Die Hauptaufgaben des PACC sind Projekte im Bereich der allgemeinen Veranlagung bzw. einer Echtzeit-Risikobewertung, die zentrale Prüfungsfallauswahl, der Auf- und Ausbau von automatisierten Prüfungen im Rahmen der Betriebsprüfung, Unternehmensgründungen, Analysen im Bereich des Umsatzsteuer-Karussellbetrugs sowie Unterstützungsleistungen im Bereich des Datenmanagements und der Betrugsbekämpfung.
Predictive Analytics
Daten werden mit statistischen und mathematischen Methoden und Modellen aufbereitet und mit Hilfe von Machine Learning und künstlicher Intelligenz "vorausschauend" analysiert. Durch den Einsatz von Predictive Analytics Methoden, der weiter ausgebaut wird, konnte das BMF die Steuerrückforderungen in den letzten Jahren bereits deutlich steigern.
Advanced Analytics
Datenanalysen zur Unterstützung für die Betriebs- und (G)PLA-Prüfung. Umfasst u.a. die Automatisierung mittels ACL, ACL Mentor sowie Registrierkassenthemen.
Tax Analytics
Analysen der betrieblichen Veranlagung, der Allgemeinveranlagung oder lohnabhängigen Abgaben.
Customs Analytics
Zollspezifische Aufgaben wie die Erstellung von Risikoprofilen, Entwicklung von Zoll-Systemen, Risikobewertung von Sendungen, internationale Projekten zur Betrugsbekämpfung.