KI Lösungen in HR können ethisch problematisch sein

In diesem Blog möchte ich deutlich machen, dass die Frage, ob Anwendungen der Künstlichen Intelligenz in der Personalarbeit ethisch problematisch oder unproblematisch sind, sich über die hinter den mathematischen Methoden der KI verborgenen Menschenbildern beantworten lässt und nicht durch emprische Verfahren oder Gütekriterien beurteilbar ist. Der Blog gibt Entscheidungsträger:innen eine Hilfestellung, ob und welchen Umfang sich KI Anwendungen unter ethischen Gesichtspunkten vereinbaren lässt.

Die Frage der ethischen Robustheit von KI Anwendungen im HR-Bereich wird durch die anstehende Gesetzgebung der EU auf der Basis der Ethikrichtlinie immer bedeutender. Da heißt es z.B.,

Hochrisikoanwendungen der KI sind u.a.
Beschaftigung, Personalmanagement und Zugang zur Selbststandigkeit (insbesondere für die Einstellung und Auswahl von Personen, für Entscheidungen über Beförderung und Kündigung sowie für die Zuweisung, Überwachung oder Bewertung von Personen in Arbeitsvertragsverhältnissen)
Verboten sind KI Anwendungen u.a.:
Bewertung oder Klassifizierung der Vertrauenswürdigkeit natürlicher Personen über einen bestimmten Zeitraum auf der Grundlage ihres sozialen Verhaltens oder bekannter oder vorhergesagter persönlicher Eigenschaften oder Persönlichkeitsmerkmale durch Behörden oder in deren Auftrag.

Zunächst stelle ich dar, was KI im Kern ist und welche Schlussfolgerungen für die Ethik daraus zu ziehen sind. Aus der Gegenstandsbeschaffenheit der KI erwachsen die Grenzen und die Möglichkeiten ihrer Anwendung für die Personalarbeit. Schließlich entstehen daraus mögliche Entscheidungskriterien für einen ethisch robusten Einsatz der KI in der Personalarbeit. Beginnen wir.

Was ist im Kern die Künstliche Intelligenz?

Als zertifizierter Manager für KI und langjähriger Personalleiter wundere ich mich, dass über den Kern der KI so wenig reflektiert wird.

KI ist im Kern mathematische Datenverarbeitung. Sie hat heute folgende Besonderheiten:

  1. Es liegen große Datenmengen vor durch das Internet und durch die digitale Transformation
  2. Es können große Datenmengen gespeichert werden
  3. Es gibt Hochleistungsrechner, die große Datenmengen schnell verarbeiten können
  4. Es hat einen methodischen Durchbruch gegeben, dass Hochleistungsrechner selbstständig aus vorstrukturieren Daten eigenständige Algorithmen entwickeln (sog. Subsymbolische Verfahren)
  5. Es gibt keine allgemeine KI, sondern für jeden Anwendungsfall eine spezielle KI Lösung.

Der vorletzte Punkt (4) ist im engeren Sinne gemeint, wenn wir heute von Künstlicher Intelligenz sprechen. Alle anderen symbolischen Verfahren sind klassische Programmierverfahren, der Syntax jederzeit nachvollziehbar ist. Bei Subsymbolischen Verfahren sind die Algrithmen, die durch den Rechner selbst erzeugt werden ohne eine nachvollziehbare Syntax. Wenn nun ein maschinell erstellter Algorithmus bei der Auswahl von Bewerber*Innen einen Diskriminierungsfehler enthält, sind diese Fehler u.a. über die Daten erkennbar, die dem maschinellen Prozess zugrundeliegen.

Wenn also die KI Anwendung im Kern Mathematik ist, dann stellt sich die grundlegende Frage, welche Fragestellungen oder Verfahren der praktischen Personalarbeit eignen sich für mathematische Verfahren und welche nicht?

Das umfasst die Fragen der Messbarkeit und die Eigenarten mathematischer Methodiken. Denn jeder Anwendungsfall aus der analogen Welt muss in mathematische Methoden und Verfahren umgesetzt werden, damit wir überhaupt von einer KI Anwendung ausgehen können.

Die Frage, was die angwandte Mathematik (Informatik) für die Personalarbeit leisten kann, ist wegen der ethischen Robustheit von zentraler Bedeutung, weil es die grundsätzliche Frage aufwirft, was den vom Menschen und seinem Verhalten in der Arbeitswelt mathematisch angemessen abbildbar ist und was nicht?

Bei Personalfragen geht es in der Praxis um das Arbeitsverhalten im umfassenden Sinne. Es umfasst neben den fachlichen, methodischen Können in aller Regel die Sozial- und Führungskompetenz. Wir können hier gut erkennen, dass menschliches Arbeits- und Sozialverhalten sehr komplex und dynamisch ist, d.h. es verändert sich durch den Kontext, in dem es stattfindet. Der Mensch ist ein komplexes und dynamisches Kontextwesen.

Es gibt noch weitere Besonderheiten des menschlichen Verhaltens. Eine Besonderheit ist, dass Verhalten, Aktivität und Motiv des Menschens auseinanderfallen. Anders gesagt, durch die Aktivität oder einer Handlung lässt sich kein Rückschluss über das Motiv ableiten. Wenn z.B. ein Menschen mit einem Fahrrad fährt, weiß ich nicht, warum er oder sie Fahrrad fährt.

Wenn man allein diese beiden Annahmen über menschliches Verhalten zustimmt, dann stellt sich die Frage, ob die Mathematik überhaupt geeignet ist, menschliches Verhalten abzubilden.

In der akademischen Psychologie gibt es eine traditionelle Richtung, die von der Messbarkeit des menschlichen Verhaltens ausgeht und sich daher als wissenschaftliche Basis für die Seriösität der KI Anwendung anbietet. Es ist der Behavorismus und die damit zusammenhängende klassische Testtheorie.

Welches Menschenbild ist im Behavorismus und in der klassischen Testtheorie enthalten?

Diese Frage ist für die ethische Beurteilung der KI Anwendungen, die sich dieser Wissenschaftstheorie bedienen, sehr entscheidend.

Der Behavorismus geht davon aus, dass sich menschliches Verhalten über Reiz-Reaktionen messen lässt. Ich gebe einer Testperson z.B. einen bestimmten Reiz (eine Frage) und die Testperson beantwortet die Frage (Reaktion). Die Testtheorie enthält vereinfacht gesagt drei Gütekritieren. Ein psycholgosicher Test muss objektiv, exakt und gültig sein.

Um eine exakte Messbarkeit menschlichen Antwortverhaltens zu ermöglichen, müssen alle Störungen, die das Verhalten unbeabsichtigt beieinflußen, beseitigt oder ausgeschlossen werden.

In der Lebenspraxis gibt es eine Menge an Störvariablen. Eine Störvariable ist, dass Menschen ihr Verhalten nach sozialer Erwünschtheit ausrichten. Um diese Störvariable auszuschliessen, werden immer mehr lebensferne und künstliche Bedingungen erzeugt, dass die Menschen sich so verhalten, wie das Experiment oder der Forscher es will.

Es dürfte deutlich geworden sein, dass der Behavorismus einer Methode der exakten Messbarkeit durch die Mathematik nachläuft und nicht nur lebensferne Ergebnisse produziert, sondern auch ein Bedingtheitsmodell herstellt. Sie ist damit im Kern eine Kontrollwissenschaft, weil sie den Menschen auf eine Bedingtheit von Input-Output reduziert.

Diese Grundannahme über menschliches Verhalten ist grundlegend wichtig, für die Anwendung mathematischer Modelle. Habe ich diese Annahme nicht, wird es schwierig, menschliches Verhalten exakt zu messen. Hier wird das Primat der Methode von dem Gegenstand gesetzt. Hier wird also an einer Methode festgehalten, die statistische Artefakte schafft. Es wird ein künstliches Narrativ erzeugt.

Für wissenschaftliche Theorienbildung gilt der Grundsatz, und das weiß jeder Handwerker, dass die Methode den Eigenschaften des Gegenstands folgen muss und nicht umgekehrt. Kein Tischler kommt auf die Idee, mit Watte Holz zu hobeln.

Ein paar Eigenschaften menschlichen Verhaltens habe ich weiter oben schon genannt (Komplexes dynamischen Verhalten im Kontext; Motiv ist nicht in Aktivitäten und Handlungen erkennbar). Die Eigenschaft des Psychischen ist durch grundlegende kategoriale Bestimmungen definierbar und nicht durch die Emperie.

Ein Intelligenztest misst nur das, was der Testkonstrukteur unter Intelligenz versteht. Die Durchführung eines Tests kann nicht die Wissenchaftlichkeit seiner Grundbegriffe beweisen, die dem Test zwangsläufig zugrunde liegen. Die Empirie als einzigen Beweisführung für die Wissenschaftlichkeit zu nehmen ist nichts weiter als in sich selbst gefangene Begründungsdiskurse und damit tautologisch.

Die kategoriale Bestimmung des Psychischen ist einer der anspruchsvollsten Theorienbildung in der Wissenschaft und muss nach ausgewiesenen Kriterien erfolgen. Der Behavorismus und die Testtheorie sind an dieser Stelle vollkommen blank. Zur Illustration dieser waghalsigen Theoriemodelle ein Beispiel zur Anschauung, wie der Big-Five Persönlichkeitstest entstanden ist, der heute als Holy Gral der Messung von Persönlichkeit gilt:

Die Entwicklung der Big Five begann bereits in den 1930er Jahren mit dem lexikalischen Ansatz, den Louis Thurstone, Gordon Allport und Henry Sebastian Odbert verfolgten. Diesem liegt die Auffassung zugrunde, dass sich Persönlichkeitsmerkmale in der Sprache niederschlagen; d. h. es wird angenommen, dass alle wesentlichen Unterschiede zwischen Personen bereits im Wörterbuch durch entsprechende Begriffe repräsentiert sind. Auf der Basis von Listen mit über 18.000 Begriffen wurden durch Faktorenanalyse fünf sehr stabile, unabhängige und weitgehend kulturstabile Faktoren gefunden: die Big Five.

Hier wird Alltagsdenken durch eine mathematische Methode der Faktorenanalyse in eine Wissenschaft verwandelt. Diese Form der wissenschaftlich stilisierten Alltagstheorie ist dort weit verbreitet, wo die begrifflichen Setzungen durch Forscher nicht auf fundierten Kategorien beruhen, sondern wo sie unhinterfragt in die Emperie eingehen. Die Emperie selbst wird als Wissenschaft angesehen.

Soweit es sich um eine Wissenschaftskritik im akademischen Elfenbeinturm bezieht, könnte man sich beruhigt zurücklehnen, weil die Sperrigkeit der Lebenspraxis einer Verbreiterung des Behavorismus die Türen verschließt. Mit der KI ist es aber nun möglich, dieses Modell massenhaft anzuwenden und damit über die Lebenswege von Menschen zu entscheiden.

Im Mainstream der akademischen Wissenschaft der Psychologie, also dem Behavorismus, wird die Frage nach der Kategorialen Definition des menschlichen Verhaltens ignoriert. Sie schimmert hinter ihrer Methodik hevor, nämlich der Mensch als Reiz-Reaktions-Wesen. Ob dieses Menschenbild im Sinne des gesellschaftlichen Nutzens und ihrer Ethik zielführend ist, wird vom Behavorismus nicht beantwortet. Es gilt das Primat der Methode vor dem Gegenstand oder der Sinnhaftigkeit von Wissenschaft für die Gesellschaft.

Das grundlegende Wissenschaftsverständnis kann empirisch nicht bewiesen werden, sondern wird auf der kategorialen Ebene entschieden.

Reduktion des Menschen auf Reiz-Reaktions-Variablen und das Festhalten an der Mathematik als geeignete Methode führt
• Suggestion der Kontrolle und damit Verfügbarkeit über das menschliche Verhalten
• Suggestion von einer Wissenschaft, die ihr fragwürdiges Niveau verbirgt und damit Leistungsversprechen suggeriert, die sie nicht erfüllen kann und als Nebeneffekt massenhafte soziale Diskriminierung durch die KI Vorschub leisten kann

Warum ist die klassische Testtheorie wissenschaftlich stilisierte Alltagstheorie und damit unwissenschaftlich?

Jede Wissenschaft muss sich die Anforderung an einen systematischen Erkenntnisfortschritt stellen. Das Gegenstandsverständnis und die wissenschaftliche Methoden müssen dies gewährleisten. Das ist beim Behavorismus – also der klassischen Testtheorie mit dem Fetisch der Messbarkeit – nicht der Fall.

Ein grundlegendes Erlebnis hatte ich im Grundlagenseminar Statistik im Grundstudium. Ein Student kam auf die weltfremde Idee, dass er die Befindlichkeit eines Menschen durch Tarot-Karten messen kann. Am Ende dieses empirischen Praktikums stellte er fest – oh Wunder – dass es keinen messbaren Zusammenhang gibt. Lassen wir den gesunden Menschenverstand mal beseite – was in der akademischen Psychologie öfter passiert – dann war wissenschaftlich nicht klärbar, ob es sich um Messfehler oder darum handelt, dass es keinen Zusammenhang zwischen der Befindlichkeit und der jeweiligen Wahl der Tarot-Karten gibt. Ein systematischer Erkenntnisfortschritt durch die Anwendung der klassischen Testtheorie ist auch deswegen nicht herstellbar, weil im umgekehrten Sinne auch nicht klärbar ist, ob der Zusammenhang zufällig oder systematisch ist.

Dem Behavorismus geht es im wesentlichen darum, im wirtschaftlichen und öffentlich-rechtlichen Kontext ihre Verwertbarkeit zu suggerieren. Hier gibt es eine Reihe legtimer Interessen.

Auf der anderen Seite stehen ethische Fragen und Fragen des Persönlichkeitsrechte, die durch unsere Demokratie und durch das Grundgesetz gegeben sind. Die spannende Frage ist, inwieweit welche Verfahren in der KI die Grenzen der Ethik und der Persönlichkeitsrechte berühren?

Dabei ist das nicht allein ein Problem der KI, sondern aller Methoden und Verfahren, die auf eine Messbarkeit und Kontrollierbarkeit menschlichen Arbeitsverhaltens ausgerichtet sind. Die KI verschärft die ethische Problematik in besonderer Weise aus folgenden Gründen:

Der Traum, menschliches Verhalten zu messen und damit kontrollierbar zu machen, ist seit der industriellen Arbeit aus Sicht der Arbeitgeber zwangsläufig. Frederic Taylor hat in seinem Buch „Shopmanagement“ 1914 den Kern eindeutig beschrieben, worum es geht: Was ich Messen kann, kann ich Kontrollieren. Dahinter steckt die Zwangsläufigkeit industrieller Arbeitsformen, die aufgrund des hohen Material- und Kostenaufwandes jede Möglichkeit des effizienten Einsatzes der Produktionsmittel steuern muss. Dazu gehört auch das Arbeitsverhalten der Menschen im Arbeitsprozess.

  1. Durch die subsymbolischen Verfahren werden die mathematischen Verfahren z.B. zur Auswahl und Bewertungen von Bewerberunterlagen zur Black-Box.
  2. Es kommt zu einer massenhaften Anwendung eines Verfahrens und kann damit im Zweifel massenhaft zu Diskriminierung führen.
  3. Die Regeln der Mathematik werden auf bestimmte praktische Fragen strikt angewendet. Die KI führt nur aus, was Menschen mit der Konstruktion der KI-Anwendung an Zielsetzung verfolgen
  4. Die Effizienzradikalität der KI Anwendung kann zum trojanischen Pferd werden, weil die Hersteller der KI Anwendung Personalentscheidungen einen breiten Schaden anrichten können.

Welche besondere Problematik liegt in der Annahme, man könne menschliches Arbeitsverhalten messen?

Nun haben sich zwar die Zeiten durch viele Veränderungen gewandelt. Das grundlegende mentale Modell über menschliche Arbeit ist insbesondere in Deutschland noch im Taylorismus verhaftet. Dafür kann man viele Indizien aufzeigen, wie z.B. die Siloorganisationen mit ihrer vertikalen Aufbau- und Ablauforganisation, die vielen gesetzlichen Regelungen udn Verordnungen der Kontrolle und des Misstrauens gegen über allen und jedem, die Null-Fehler-Toleranz, der Drang nach Perfektionismus u.v.a.m. Alles gute Gründe für umfassende Messbarkeit und Kontrolle.

Die Anwendung der Künstlichen Intelligenz in der Personalarbeit zielt auf das Leistungsversprechen der Effizienzradikalität ab, die im Kern die Digitalsierung als eine Art Supertaylorismus nutzt. Mit den KI Anwendungen werden viele Einsparungs- und Gewinnmöglichkeiten versprochen, die hoch attraktiv für Entscheidungsträger*Innen sind. Und das macht die Anwendungsattraktivität der KI in der Personalarbeit so brisant.

Dabei ist die Frage von zentraler Bedeutung, welches Menschenbild hinter dem Behavorismus steckt, weil es die Anwendung der Mathematik als wissenschaftlichen Fetisch aufdeckt. Die Psychologie ist in ihrem Leistungsversprechen gegenüber Geldgebern immer dann attraktiv, wenn es durch ihre Verfahren und Methoden die exakte Messbarkeit und Kontolliebarkeit suggeriert.

  

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s