Außenprüfungen der Finanzverwaltung bedeuten für den Steuerpflichtigen regelmäßig nicht nur eine zeitliche und organisatorische Belastung, sondern vielfach auch steuerliche Mehrbelastungen, zumindest aber Verschiebungen von Steuerbelastungen mit negativen Zinsfolgen. Umso wichtiger sind die Kenntnis der Rechte und Pflichten und eine sorgfältige Vorbereitung auf eine anstehende Betriebsprüfung.
Die Betriebsprüfungsordnung (BpO) schreibt vor, dass jedes Unternehmen in eine der nachfolgenden Größenklassen eingeteilt werden muss:
Größenklasse des Betriebs | Durchschnittlicher Prüfungsturnus |
---|---|
Kleinstbetrieb (KSt) | 100 Jahre |
Kleinbetrieb (K) | 30 Jahre |
Mittelbetrieb (M) | 15 Jahre |
Großbetrieb (G) | 4,5 Jahre |
Wir unterstützen Sie bei anstehenden Betriebsprüfungen durch
„Plausibilisierung“ hat etymologisch viel mit „Applaus“ gemeinsam. Die Wurzel beider Wörter ist „plaudere“, lat. (Beifall) klatschen. Dies legt die Vermutung nahe, dass es beim Plausibilisieren nicht um die Kontrolle bzw. um das Überprüfen des Wahrheitsgehalts einer bestimmten Aussage, sondern von vornherein darum geht, eine Feststellung so zu bestätigen, dass sie die Zustimmung der Adressaten erhält. Diese erliegen dennoch häufig dem Missverständnis, dass das Plausibilisieren eine Form des Verifizierens einer Aussage oder gar eine unabhängige Gegenrechnung sei – was wünschenswert wäre, aber nicht der Realität entspricht. Da im Zusammenhang mit Schätzungen anlässlich von Betriebsprüfungen vielfach zusätzliche Berechnungen und Überlegungen als „Plausibilisierungen“ bezeichnet werden, soll im Folgenden erörtert werden, welche Funktionen Plausibilisierungen in der Schätzungspraxis tatsächlich erfüllen und welche einen Sinn geben.
Al sein wichtiges Instrument der juristischen Rhetorik steht bei Vorliegen unterschiedlicher Standpunkte die Erlangung von Zustimmung anderer (= Plausibilisierung) im Zentrum der Bemühungen des Verwenders.2 Eine Aussage wird als „plausibel“ (Beifall verdienend) bezeichnet, wenn diese geeignet ist, die Zustimmung einer anderen Person für den eigenen Standpunkt zu gewinnen. Die Plausibilität als subjektives Beurteilungskriterium und probates Verhandlungsinstrument hat nichts mit dem Streben nach objektiver Wahrheit (bzgl. deskriptiver Aussagen) oder objektiver Richtigkeit (bzgl. normativer Aussagen) zu tun, sondern mit der erfolgreichen Verfolgung eigener Zielsetzungen. Bei Schlussbesprechungen sind üblicherweise beide Beteiligte um Plausibilität bemüht, d. h., beide wollen die Zustimmung des anderen zum jeweils eigenen Standpunkt.3
Die Plausibilisierung ist innerhalb der klassischen Rhetorik eine von fünf gängigen Ansatzpunkten zur Erlangung der begehrten Zustimmung eines anderen:
1. Der erste Ansatzpunkt bezieht sich auf die Wirkungsweise des eigenen Vorbringens und knüpft an die officia oratoris an mit den drei Begriffspaaren docere et probare (belehren, argumentieren), conciliare et delectare (gewinnen, erfreuen) und flectere et movere (rühren, bewegen).4
2. Beim zweiten Ansatzpunkt bedient man sich der fünf Argumentationsweisen aus dem Sachverhalt zur ÜberzeugungdesGegenübers,5 nämlich:argumenta a persona (Personenargumente), argumenta ex causis factorum vel futurorum (Argumente der bereits geschehenen und künftig zu erwartenden Handlungen), argumenta ex loco (Argumente vom Ort her), argumenta ex tempore (Argumente aus der Zeit) und Argumente mit Blick auf die „Möglichkeit“.6
3. Es kann ferner zur Überzeugung des Adressaten an Autoritäten, insbesondere an die ständige RechtsprechungdesBVerfG,desBFH,derFG,andieherrschende oder überwiegende Meinung oder an die Reputation von Steuerexperten angeknüpft werden.7 Hier geht es um Meinungsherrschaft.
4. Es kann, um die Zustimmung des Adressaten zu gewinnen, an die Einflussnahmemöglichkeiten von Institutionen mit Durchsetzungskraft (Politik, Ministerien, Medien) angeknüpft werden.
5. Es kann schließlich – wenn es um Rechenergebnisse geht – zur Überzeugung des Gegenübers an Nachrechnungen angeknüpft werden, die als „plausibel“ bezeichnet werden.
Zwar ist die Erlangung von Wahrheit und Richtigkeit das Ideal bzw. Ziel einer jeden steuerjuristischen Betätigung. Dies wird durch das Amtsermittlungsprinzip im Steuerrecht (§88 AO) auch explizit gefordert. Die Wirklichkeit in der steuerlichen Außenprüfungspraxis sieht bisweilen anders aus, wenn der Eindruck vermittelt wird, es gehe nur um die Generierung maximaler Mehrergebnisse, um die Durchsetzung des eigenen Standpunkts und/oder um Gesichtswahrung. Die Nähe zu einem türkischen Basar kann durchdieinflationäreVerwendungvonSicherheitszuschlägen, durch die Zulässigkeit von fragwürdigen „amtlichen“ Richtsätzen und – letztlich – durch das Instrument der „Plausibilisierung“ bewirkt werden.
EsistdasnatürlicheAnliegeneinesjedenBetriebsprüfers, dass er Vorsorge trifft, dass in Schätzungsfällen sein Mehrergebnis Bestand vor seinem Sachgebietsleiter und später vor dem FG hat; ebenso ist ein FG motiviert, dass im Falle der Übernahme der Schätzung des Betriebsprüfers oder im Falle einer selbst durchgeführten Schätzung
die Entscheidung revisionssicher ist. Soll solch ein durch Plausibilisierung gestütztes Schätzungsergebnis angegriffenwerden,istdieserstrechtschwierig,wenndieZielsetzung der Plausibilisierung nicht erkannt wird.
Zur Fundierung eines selbst errechneten Schätzungsergebnisses gibt es – jenseits der AO – verschiedene Strategien, beispielsweise, dass von verhandlungserprobten Amtspersonen starker Einigungsdruck auf den unbedarften Steuerpflichtigen ausgeübt wird8 oderdieBegründung minimalisiert wird9 oder gar ganz entfällt10 oder die gefundenen Mängel ins Uferlose aufgebauscht werden,11 die erforderlichen Tatsachenfeststellungen durch Mutmaßungen über „Möglichkeiten“ von Handlungsweisen des Steuerpflichtigen ersetzt werden12 oder die Begründung – von der Tatsachenfeststellung weg – durch eine Fülle von Zitaten aus der Judikatur und der Verwaltung vollgepackt wird13 oder für den Steuerpflichtigen nachteilige Entscheidungen anderer Finanzgerichte in den Fokus gerückt werden oder letztlich das gefundene Schätzungsergebnis durch eine „Plausibilisierung“ gestützt wird.
DiePlausibilisierungeinesSchätzungsergebnissesstelltim Vergleich zu den genannten Alternativen eine sachbezogene, eher harmlos erscheinende, im Übrigen aber schlecht durchschaubare Methode zur Verfestigung des eigenen Standpunktsdar,dergegenübereinemunbedarftenAdressaten eine hohe Überzeugungskraft zugemessen wird. „Sie [die Plausibilisierung] ist der ins Rhetorische gewendete Begriff von Wahrheit und Richtigkeit.“14 Letztlich führt die Plausibilisierung nicht zu einem Erkenntnisgewinn: Die unscharfe Methode der „Schätzung“ wird durch eine andere unscharfe Methode mit überdies anderer Zielsetzung, die „Plausibilisierung“, überprüft.
Dass der Begriff „Plausibilisierung“ im Kern eine rhetorischeFigurist,diedenSinnhat,einenanderenzuüberzeugen ohne Rücksicht auf den Wahrheitsgehalt des plausibilisierten Sachverhalts, ist im Steuerrecht der FinVerw genau so wenig bewusst wie den FG oder dem Steuerpflichtigen. Jeder der am Besteuerungsverfahren Beteiligten verbindet andere Vorstellungen mit dem Begriff „Plausibilisierung“. Der Steuerpflichtige denkt an eine messerscharfe Kontrolle, das FG an die methodische Überprüfung eines Schätzergebnisses, die FinVerw sucht nach Bestätigung durch Plausibilisierung, ohne sich das bewusst zu machen. Dass jeder Beteiligte etwas anders unter Plausibilisierung versteht, liegt an der Mehrdeutigkeit des Begriffs und am Fehlen einer klaren Methodik desPlausibilisierensimSteuerrecht.JederderamSteuerverfahren Beteiligten richtet den Blick nur auf den jeweils für ihn und seine Interessen relevanten Aspekt des InterpretationsspektrumsdiesesBegriffsundverdrängtdieübrigen Bedeutungsinhalte, die seine Wunschvorstellung konterkarieren. Der Umgang mit dem Wort „Plausibilität“ und „Plausibilisieren“ ist im Steuerverfahren demnach oft unbedarft und lädt zum Missbrauch ein. Um die Methode des „Plausibilisierens“ im Steuerrecht künftig besser analysieren und rechtlich bewerten zu können, soll daher im Folgenden der Nebel, der diesen Begriff einhüllt, gelüftet werden, indem die fünf Funktionen aufgefächert werden, die das „Plausibilisieren“ in der Praxis des Steuerrechts hat.NebendenScheinargumentations-undBegründungsersatzfunktionen kommt dem Plausibilisieren aus Sicht der am Steuerverfahren Beteiligten eine Unterstützungs-, Überprüfungs- und Kontrollfunktion zu. Dabei wird untersucht, welcher der Protagonisten von Schätzungsverfahrens welche dieser fünf Funktionen favorisiert. Auf diese Weise lässt sich die Plausibilisierungspraxis anhand der fünf Grundfunktionen analysieren und die diffuse Vorstellung von der Leistungsfähigkeit des Instruments des „Plausibilisierens“ im Steuerrecht versachlichen. Dabei lässt sich feststellen, dass die Plausibilisierungspraxis im Steuerrecht nicht weit entfernt ist von der ursprünglichen Bedeutung des Begriffs, wonach es beim Plausibilisieren nur darum geht, den Applaus für eine eigene Aussage zu bekommen und nicht um Kontrolle.
1. Scheinargumentationsfunktion
Die Scheinargumentationsfunktion bezieht sich auf die Möglichkeit, die Vokabel „plausibel“ bzw. „Plausibilisierung“ als Füllwort zu nutzen, also als einen Begriff mit minimalem Aussagewert, welcher zum Verständnis des Zusammenhangs nicht erforderlich ist. Wegen der sonst fehlenden Begründung soll einer Schätzung ein seriöser, überzeugender Anstrich gegeben werden. Ein konkreter Begriffsinhalt ist in diesem Falle nicht erkennbar und die VerwendungderVokabeln„plausibel“bzw.„Plausibilisierung“ ist inhaltsleer und mutiert zur Scheinargumentation. Die Verwendung derartiger Füllwörter (Phrasen, Worthülsen) soll suggerieren, dass die zu beurteilende
Aussage „einleuchtend“, „verständlich“ und „offenkundig“ ist. Im Ergebnis bedeutet dies aber, dass der Begriff „Plausibilisierung“ nur dem Anschein nach etwas Zutreffendes aussagt, in Wirklichkeit aber viel zu unbestimmt ist, um eine solche Behauptung überprüfen zu können. Dies ist insbesondere der Fall, wenn die Plausibilisierung einesSchätzungsergebnissesnichtrechnerisch,sondern bloß verbal erfolgt,15 insbesondere i. V. m. den Begriffen moderat, ungefähr, vernünftig, vertretbar, angemessen, schlüssig, wirtschaftlich möglich, nachvollziehbar.16
2. Begründungsersatzfunktion
Die Begründungsersatzfunktion bezieht sich auf die Präsentation eines nach außen überzeugend erscheinenden Begründungsersatzes für ein bereits gefundenes oder behauptetes Ergebnis. Grund ist, dass der BFH in mehreren Entscheidungen zu Schätzungen eine „Begründungstiefe“17 im Hinblick auf die vorgetragene Argumentation angemahnt hat. Diese kann aber bei der Multiplikation eines Prozentsatzes X mit einer Bezugsgröße Y (i. d. R. Umsatz) denknotwendig nicht gegeben werden. Der Multiplikatoristdurchwegwillkürlichgewähltundverhandelbar; der Multiplikand, also der Umsatz, ist, insbesondere für Gewinnzuschätzungen, zwar feststehend, aber mehr als vage, zumal dieser ja falsch sein soll. Diese erforderliche, aber bei Sicherheitszuschlägen nicht mögliche BegründungstiefewirddanndurcheinenachgelagertePlausibilisierung, z. B. mittels bloßem Hinweis auf „amtliche“ Richtsätze der FinVerw, ersetzt.18
3. Unterstützungsfunktion
Die Unterstützungsfunktion bezieht sich auf die Bestätigung des als richtig erachteten und der Besteuerung zu Grunde zu liegenden Primärergebnisses. Es wird dem Steuerpflichtigen zwar eine zweite Berechnung vorgegeben, deren Oberflächlichkeit aber offenkundig ist und vom Verwender (Finanzamt) bisweilen auch offen als „überschlägig“ bezeichnet wird; schließlich hätte der Steuerpflichtige ja eine ordnungsgemäße Kasse führen können. Ist kein Einlenken des Steuerpflichtigen erkennbar, wird ergänzend noch mit den Argumenten einer Urkundenunterdrückung durch den Steuerpflichtigen und
eines Beweisverderbers (auch „Beweisvereitelers“),19 einer noch höheren Schätzungsmöglichkeit innerhalb des Schätzungsrahmens,20 der Prüfung auf Einleitung eines Strafverfahrens usw. gearbeitet. Hierzu ein Beispiel: Das Primärergebnis ergibt sich auf Grund eines Sicherheitszuschlags; dieses Ergebnis wird durch den Hinweis auf den vorhandenen „Schätzungsrahmen“ bzw. auf die obere Grenze von Richtsätzen „plausibilisiert“.
4. Überprüfungsfunktion
Die Überprüfungsfunktion bezieht sich auf die Überprüfung der Rechenlogik und der einzelnen Rechenschritte des Schätzungsergebnisses. Eine Sekundärrechnung unterbleibt. Der Hauptnachteil ist die Einseitigkeit dieser Vorgehensweise. Diese erfordert ein Beherrschen des vom Prüfer verwendeten Schätzungsverfahrens einschließlichseinersubjektivenrechnerischenundverfahrensmäßigen Eigenheiten, weshalb es die bevorzugte Vorgehensweise bei Finanzgerichten ist, den gerichtseigenenPrüferhiermitzubeauftragen.AnerkannteStandards für Schätzungsmethoden, die nachvollziehbar eine Beurteilung durch den Adressaten ermöglichen, gibteswegenderVielzahlderVariantenundVorgehensweisennicht.VonbesondererSchwierigkeitistdieÜberprüfung von statistisch-mathematisch geprägten Verfahren sowie von Verfahren, bei denen die empirische Validierung (Feldexperiment mit Kontrolle der Erfüllung vorgegebener Ziele und der Tauglichkeit gestellter Anforderungen) fehlt.21 Ausschließlich theoretisch geprägten Verfahren ist keine praktische Verwendungsfähigkeit zuzubilligen.
5. Kontrollfunktion
Die Kontrollfunktion verlangt, dass eine sorgfältig durchgeführte Kontrollrechnung im Sinne einer Gegenrechnung erfolgt. Dies ist z. B. der Fall, wenn primär eine Nachkalkulation (im Sinne einer Gewinnentstehungsrechnung) erfolgt und sekundär als Gegenrechnung eine Geldverkehrsrechnung (im Sinne einer Gewinnverwendungsrechnung) durchgeführt wird (oder umgekehrt). Hierbei ist die Rechenbasis und Rechenlogik bei beiden Berechnungen vollkommen verschieden (anders ist dies bei einer Richtsatzschätzung i. V. m. einer Nachkalkulation). Zur Ordnungsmäßigkeit einer Kontrollrechnung gehören – wie bei der Ermittlung des Primärergebnisses – methodische Qualität und eine zutreffende Erhebung und Dokumentation der Schätzungsgrundlagen.22 Im Ergebnis ist die Plausibilisierung eines Primärergebnisses durch eine Gegenrechnung zu Kontrollzwecken für den Steuerpflichtigen ein von vornherein anzustrebendes Ziel in Schätzungsfällen; die anderen Funktionen sollten als solche identifiziert und entsprechende Vorgehensweisen verhindert werden.
Analysiert man Urteile der FG zur Plausibilität von Schätzungsergebnissen der FinVerw, fällt auf, dass es keine klaren Vorgaben zur Qualität und Methodik von Plausibilisierungen gibt. Der Umgang mit dem Begriff Plausibilität ist beliebig und lädt zur Scheinargumentation vor Gericht ein. Zwar wird gefordert, dass Schätzergebnisse „plausibel“ sein müssen, was unter Plausibilität zu verstehen ist, bleibt aber im Dunkeln (s. dazu die nebenstehende Rechtsprechungsübersicht mit Beispielen aus der FG-Rechtsprechung). Was plausibel erscheint, wird von den FG als zutreffend angesehen, obwohl es nachweisbar zwischen der Plausibilität und dem Wahrheitsgehalt einer Aussage keinen zwingenden Zusammenhang gibt.
Beispiele aus der FG-Rechtsprechung zum Begriff der Plausibilisierung
FG Köln vom 21.3.1995, 13 K 6492/94
„Indessen darf das Finanzamt … nicht bewusst zu hoch schätzen. Die Schätzung darf nicht zu einer Strafsteuer führen. Es dürfen nicht im Zweifel zu Lasten des Steuerpflichtigen Annahmen gemacht werden, die unrealistisch sind. Dies verstieße gegen das Schätzungsziel, die wahrscheinlichsten (plausibelsten) Besteuerungsgrundlagen zu bestimmen. … Ob die Schätzungen hier plausibel waren, ist nicht in erkennbarer Weise überprüft worden.“
Der Begriff „plausibel“ wird im Hinblick auf die Verfolgung des Schätzungsziels aufgewertet. Es wurde klargestellt, dass Schätzungen auf Plausibilität zu überprüfen sind. Es handelt sich um eine mutige und konstruktive Entscheidung. Die Gleichsetzung von „wahrscheinlich“ und „plausibel“ ist problematisch.
FG Sachsen vom 19.12.2002, 5 V 415/02
„Zieht man die in der sog. Richtsatzsammlung festgehaltenen Durchschnittswerte … zur Plausibilitätskontrolle ergänzend heran, liegt das im AdV-Verfahren … ermittelte Schätzungsergebnis nicht wesentlich über dem vorgegebenen Rahmen, so dass sich auch von dieser Seite her keine Bedenken ergeben.“
Hier wird so getan, als ob von zwei Seiten her Berechnungen erfolgten, die zum gleichen Ergebnis führten. Zumindest hätte diese Plausibilisierung bezüglich des Zahlenwerks detailliert im Bp-Bericht bzw. in der Begründung aufgeführt werden müssen.
FG Hamburg vom 2.3.2005, IV 150/03
„Fraglich erscheint dem beschließenden Senat, ob unter Berücksichtigung der vorstehend beschriebenen Umstände ausnahmsweise ein geringerer Beweismaßstab – etwa lediglich eine Glaubhaftmachung oder Plausibilitätsprüfung – ausreichend ist.“ In dieser Entscheidung stellt die Plausibilisierung einen geringen Beweismaßstab unterhalb einer bloßen Glaubhaftmachung dar.
Nieders. FG vom 31.3.2005, 14 V 194/04
„Die vom Antragsgegner in den Streitjahren 1991, 1993, 1995 bis 1999 hinzu geschätzten Beträge sind jedoch der Höhe nach für das Gericht nicht nachvollziehbar. … Denn es fehlt auch insoweit an der Plausibilität der Schätzungsbeträge. Auch hier kann das Gericht weder die einzelnen Rechenschritte noch die Berechnungsgrundlagen des Antragsgegners überprüfen.
“ Das Gericht verwendet den Begriff „Plausibilität“ in einer neuen Bedeutungsvariante. Es wurde hier keine gesonderte Plausibilisierungsprüfung angemahnt, sondern es fehlte bereits die (vollständige) Begründung für das primäre Schätzungsergebnis.
Nieders. FG vom 8.12.2011, 12 K 389/09
„Bei einer offenen Ladenkasse kann die Plausibilität der Aufzeichnungen durch die Sammlung von Kassenzetteln erhöht werden.“ Die Prüferin hatte Sicherheitszuschläge i. H. v. 3 400 € und 600 € netto jährlich angesetzt. Hier geht es nicht um die Plausibilität der Ergebnisse der Primärschätzung, sondern von „Aufzeichnungen“.
Wie Aufzeichnungen auf „Plausibilität“ hin geprüft werden können, erschließt sich nicht aus der weiteren Begründung. FG Köln vom 1.3.2012, 10 K 688/10
„… ein Gutachten [befreit] nicht von einer sorgfältigen Plausibilitätskontrolle“.
Es ist bemerkenswert, dass auch ein FG den erweiterten Begriff der Plausibilitätskontrolle und zusätzlich das Attribut der „Sorgfältigkeit“ verwendet. Erstaunlich ist auch, dass üblicherweise in Bewertungsgutachten das gefundene Ergebnis nach IDW S 1 bereits vom Gutachter einer Plausibilitätskontrolle zu unterziehen ist, diese offenbar aber nicht ausreicht, und vom Adressaten zusätzlich, nunmehr aber eine „sorgfältige“ Plausibilisierungskontrolle durchzuführen ist.
Dem Wildwuchs in der FG-Rechtsprechung hat der BFH Grenzen gesetzt, indem er in seiner Rechtsprechung einige bedenkenswerte Vorgaben zur Ausgestaltung von Plausibilisierungen gemacht hat. Besonders aufschlussreich ist hier das Zeitreihenurteil, in dem der BFH den Begriff der „Plausibilitätsprüfung“ eingeführt hat. Die Prüfung der Plausibilität im Sinne der BFH-Rechtsprechung unterscheidet sich von der diffusen Plausibilitätsbeurteilung von Schätzergebnissen der FinVerw durch Qualitätsanforderungen, die in der FG-Rechtsprechung nicht erkennbar sind. Der BFH fordert im Zeitreihenurteil von einer Plausibilitätsprüfung Folgendes:23
„In diesen Fällen sind andere Schätzungsmethoden, die auf betriebsinternen Daten aufbauen oder in anderer Weise die individuellen Verhältnisse des jeweiligen Steuerpflichtigen berücksichtigen (z. B. Vermögenszuwachsoder Geldverkehrsrechnung, Aufschlagkalkulation) grundsätzlich vorrangig heranzuziehen. ... Diese Ergebnisse sind vom FA und FG aber – auch von Amts wegen – stets
auf ihre Plausibilität anhand der besonderen betrieblichen Verhältnisse des Steuerpflichtigen zu überprüfen. ... Da solche Unsicherheiten aber aufgrund der dem Zeitreihenvergleich innewohnenden Hebelwirkung erheblich verstärkt auf das Schätzungsergebnis ‚durchschlagen‘, ist in derartigen Fällen ... eine Plausibilitätsprüfung der Ergebnisse des Zeitreihenvergleichs vorzunehmen, die sich nicht allein auf einen summarischen Vergleich mit den amtlichen Richtsätzen beschränken darf.“24
Eckpunkte des BFH für Plausibilitätsprüfungen:
1. Statt von Plausibilisierung sollte von einer Plausibilitätsprüfung gesprochen werden. Der Schwerpunkt liegt offensichtlich auf dem Wortteil „Prüfung“.
2. Gegenstand der Plausibilitätsprüfungen sind die „Ergebnisse“ der (primär) verwendeten Methoden. Die Prüfung nur von einzelnen Teilaspekten genügt hiernach nicht.
3. Eine Beschränkung auf einen summarischen Vergleich mit den amtlichen Richtsätzen ist unzulässig (genau dies ist aber durchgängige Praxis).
4. Die Plausibilitätsprüfung ist „von Amts wegen“ vorzunehmen (und nicht erst, wenn die Schätzung von dem Steuerpflichtigen angezweifelt wird).
5. Kriterien der Prüfung sind die „besonderen betrieblichen Verhältnisse des Steuerpflichtigen“. Die vom BFH genannten Merkmale „besonders“, „betrieblich“ und „des Steuerpflichtigen“ wiegen schwer.
Diese Vorgaben stellen die Messlatte für die Beurteilung von Plausibilisierungen dar und machen den Unterschied aus zwischen einer Plausibilitätsprüfung im Sinne des BFH als Mindeststandard zur Überprüfung von Schätzergebnissen und den Plausibilitätsurteilen, die bisher in derFG-Rechtsprechungüblichwarenunddiesog.Plausibilisierungen zu kaum überprüfbaren Feststellungen im Sinne eines Glaubensbekenntnisses gemacht haben.25
Ob Plausibilitätsprüfungen, wie sie der BFH fordert, sinnvoll und praktikabel sind, werden Steuerpflichtige, FinVerw und FG unterschiedlich beurteilen, weil sie im Besteuerungsverfahren unterschiedliche Funktionen erfüllen. Daher kann die Tauglichkeit von Verfahren, die bei Plausibilisitätsprüfungen im Sinne der BFH-Rechtsprechung zum Einsatz kommen können, an fünf Krite
rien untersucht werden, die neben Qualität und Genauigkeit der jeweiligen Methode auch pragmatische Erwägungen wie Zeit, Kosten und Überzeugungskraft berücksichtigen. Jeder dieser fünf Beurteilungsaspekte hat seine Berechtigung. Praktikabilitätsaspekte sind ebenso wichtig wie die Qualitätsaspekte, die der BFH in seiner Rechtsprechung in den Mittelpunkt stellt. Eine Plausibilitätsprüfung ist, wenn sie nicht finanzierbar ist oder Jahre dauert, nichts wert. Umgekehrt darf man eine oberflächliche Plausibisierung nicht als Plausibilitätsprüfung im Sinne der BFH-Rechtsprechung einsetzen mit dem Hinweis darauf, dass sie Zeit spart und kostengünstig ist, wenn sie den Anforderungen des BFH an Qualität und Genauigkeit der Methode nicht gerecht wird. Bei der Auswahl der am besten geeigneten Methode müssen pragmatische Erwägungen und Qualitätsaspekte gegeneinander abgewogen werden, wobei die Rechtsprechung des BFH deutlich macht, dass Qualitätsaspekte bei der Auswahl stärker ins Gewicht fallen als pragmatische Erwägungen. Die pragmatischen Aspekte dürfen nicht im Vordergrund stehen bei der Methodenwahl, müssen aber mitbedacht werden.
Beurteilungsaspekte für Plausibilitätsprüfungen:
1. Qualitätsaspekt Ist das Verfahren zur Nachprüfung am besten geeignet?
2. Genauigkeitsaspekt Wie realistisch ist das mit der Methode erzielbare Ergebnis?
3. Zeitaspekt Wie schnell liegt ein Ergebnis vor?
4. Kostenaspekt Wie hoch ist der kostenmäßige Aufwand?
5. Überzeugungsaspekt Wie gut bewährt sich die Methode in Verhandlungen?
1. Qualitätsaspekt
Im Zeitreihenurteil hat der BFH in Leitsatz 3 die unterschiedliche Geeignetheit von Schätzungsverfahren im Sinne eines Gütekriteriums explizit angesprochen und ausgeführt, dass zu prüfen ist, ob „andere Schätzungsmethoden,dieaufbetriebsinternenDatenaufbauenoder inandererWeisedieindividuellenVerhältnissedesjeweiligen Steuerpflichtigen berücksichtigen, nicht sinnvoll einsetzbar sind“.26 Ergänzend zur grundsätzlichen Einsetzbarkeit sind nach Rz.64 diese Schätzungsmethoden (explizit genannt: Vermögenszuwachs- oder Geldverkehrsrechnung, Aufschlagkalkulation) „grundsätzlich vorrangig heranzuziehen“. Nach Rz.67 muss ein„summarischer Vergleich mit den amtlichen Richt
sätzen“ unterbleiben. Eine im Zuge des vermeintlichen27 Auswahlermessens präferierte Verwendung von Sicherheitszuschlägen als Schätzungsverfahren im Rahmen einer griffweisen Schätzung28 ist hiernach nicht vorgesehen.29 Damit dürfte gleichzeitig der Rahmen für die Verwendung von Verfahren für die Plausibilitätsprüfung eines Primärergebnisses abgesteckt sein. Es muss vermieden werden, dass Oberflächlichkeit mit Oberflächlichkeit verglichen wird.
2. Genauigkeitsaspekt
Nach dem auch hier maßgeblichen Zeitreihenurteil ist bei einer Schätzung „das Ziel, die Besteuerungsgrundlagen durch Wahrscheinlichkeitsüberlegungen so zu bestimmen, dass sie der Wirklichkeit möglichst nahe kommen“.30 „Möglichst nahe“ heißt: möglichst genau. Dies gilt erst recht für Plausibilitätsprüfungen, weil die Zielsetzung die gleiche sein muss wie bei der Herleitung des Primärergebnisses. Es kann an die Abstufungen bezüglich der Funktionen angeknüpft werden, d. h. die zuerst genannte Funktion hat den geringsten Genauigkeitsgrad usw. Die Genauigkeit von Verfahren lässt sich empirisch überprüfen, insbesondere durch Feldexperimente, die objektiv und öffentlich
nachprüfbar gestaltet sind. Bislang gibt es keine Bandbreiten von Wahrscheinlichkeiten, die einzelnen Verfahren zugeordnet werden.
3. Zeitaspekt
Eine überschlägige Berechnung beansprucht deutlich wenigerZeit.Daheristesverständlich,wennbeizweiVerfahren dasjenige, welches mehr Zeit beansprucht, für die Herleitung des Primärergebnisses und das vergleichsweise schnellere Verfahren für eine Plausibilitätsprüfung verwendet wird. In der Praxis ist es aber häufig umgekehrt, weil Sicherheitszuschläge für die Herleitung des PrimärergebnissesvonAußenprüfernvorrangigverwendet werden, obgleich dies als Anwendung von subjektiven Faustregeln eine Angelegenheit von wenigen Minuten ist. Es mutet daher eigenartig an, wenn ein Außenprüfer bei einer Prüfung, die sich über Wochen hinzieht, aufwendig nachkalkuliert, mit vielen Preislisten und BerücksichtigungvonAktionsangebotenundÄnderungdesSpeisekonzepts sich beschäftigt, am Ende aber Prozentsätze für Sicherheitszuschläge unter Verzicht auf eine Plausibilitätsprüfung präsentiert.
4. Kostenaspekt
Verfahren mit geringen Kosten sind gegenüber der Alternative der Plausibilitätsprüfung, also der Nachprüfung eines Ergebnisses durch eine vollständig und sorgfältig durchgeführte andere Methode, ggf. mit Hilfe eines Sachverständigen für Registrierkassen, im Sinne einer vollständigen Gegenrechnung von Vorteil. Um Letzterem zu entgehen, ist für den Betriebsprüfer der Plausibilisierungsansatz wie geschaffen: Man will von vornherein erst gar nicht genau und vollständig, sondern mit (vom Steuerpflichtigen wegen seiner mangelbehafteten Kassenführung hinzunehmender) Unschärfe arbeiten. Der Umfang der Oberflächlichkeit einer durchgeführten Plausibilitätsprüfung würde damit kaschiert.
5. Überzeugungsaspekt
Eine Plausibilitätsprüfung sollte im Idealfall auch Überzeugungskraftbesitzen,denndasdientdemRechtsfrieden.Die ÜberzeugungskraftdarfabernichtdasBedürfnisnachQualität und Genauigkeit der Plausibilitätsprüfung überspielen. Deshalb hat bei der Beurteilung eines Verfahrens der Überzeugungsaspekt ein geringeres Gewicht als der Qualitätsaspekt. Ein wichtiges Element des Überzeugungsaspekts ist die Freiwilligkeit, auf der die Akzeptanz einer Ansicht bei dritten Personen (Adressaten) beruht. Hierzu ist das Erzeugen einer positiven Einstellung der Gegenseite zum eigenen Standpunkt für den Anwender einer Plausibilisierung oft der mit Abstand wichtigste Aspekt. Diese positiveEinstellungwirdgefördert,indemKonzilianzsignalisiert und bei der „Plausibilisierung“ ein Ergebnis von vornherein als überschlägig und verhandelbar bezeichnet wird. Hierdurch werden Gegenargumente bereits im Vorfeld abgefedert.
Die Überzeugungswahrscheinlichkeit gegenüber dem Adressaten einer Plausibilitätsprüfung steigt:
* wenn die Vorgehensweise vom Adressaten verstanden wird („Verständnis“),31
* wenn das der Plausibilisierung zu Grunde liegende Zahlenwerk valide ist („Validität“),32
* wenn die objektive Vorgehensweise des Prüfers erkennbar ist („Objektivität“),33
* wenn der Schätzungsrahmen klein ist („Bandbreite“),34
* wenn die Stärken und Schwächen bekannt sind („Stärken/Schwächen“),35
* wenn Messlatten oder Standards für eine Beurteilung vorhanden sind („Maßstab“),36
* wenn die resultierenden Verpflichtungen bezahlbar sind („Bezahlbarkeit“).37
Die Forderung nach einer bloßen Plausibilisierung ganz ohne Qualitätskriterien ist nicht unproblematisch. Das zeigen Beispiele jenseits des Steuerrechts, wo ebenfalls mit Plausibilisierungen gearbeitet wird und wurde, ohne die Unschärfe des Begriffs und der Methode des Plausibilisierens zu hinterfragen. In der Finanzmarktkrise wurde der Plausibilisierungsansatz z. B. bei der Bewertung strukturierter Papiere angewendet, was am Ende zu einer Verschärfung der Krise führte.38 So hatte z. B. der Abschlussprüfer im HRE-Untersuchungsausschuss sich mit Zeugenaussage am 2.7.2009 damit herausgeredet, dass die Werte im Jahresabschluss „geprüft und nachvollzogen und als plausibel eingestuft“ wurden, obgleich, wie sich später herausstellte, vom Steuerzahler laut Statistischem Bundesamt 2012 bis zu 51,8 Mrd. € an Ausfällen sowie 480 Mrd. € an Bürgschaften zu tragen waren. Nach einer Analyse von Hartmann-Wendels/Hellwig/Jäger-Ambrozewicz zum Entstehen der Finanzmarktkrise „haben die makroökonomischen Rahmenbedingungen die Fehlentwicklung begünstigt“, weil u. a.„die Ansicht vorherrschte, dass Risiken besser verteilt seien (so dass geringe Risikoprämien
plausibel erschienen)“.39 In den USA hatte man aus dem Plausibilisierungsdebakel der Finanzmarktkrise gelernt und dem Plausibilisieren ein Ende bereitet. Vor über zehn Jahren wurde als Folge der Finanzmarktkrise der bis dato bei Wirtschaftsprüfungen vorherrschende US-amerikanische Plausibilisierungsansatz konsequent durch den „risikoorientierten Prüfungsansatz“ abgelöst; nunmehr können sich Prüfer nicht mehr so leicht hinter Plausibilisierungsüberlegungen verstecken. Ferner: Das Kraftfahrt-BundesamthattedievondenHerstellernvorgelegtenAbgasergebnisse vielfach nur auf Vollständigkeit und Plausibilität überprüft. Bei der Bearbeitung von Asylverfahren konnten vielfach die (unzureichenden bzw. unvollständigen) Anträge nur auf Plausibilität hin geprüft werden.
Im deutschen Verfahrensrecht sind außerhalb des steuerlichen Beweisrechts Plausibilisierungen in anderen Rechtsgebieten nach wie vor weit verbreitet, so etwa im strafprozessualen Beweisrecht, wo die Überprüfung von Tatschilderungen durch Richter mittels Plausibilitätserwägungen wegen der Subjektivität und Emotionalität von Plausibilitätsurteilen immer wieder als mögliche Quelle für Fehlurteile kritisiert wird:
Ähnliche Plausibilitätserwägungen finden sich bei der Beurteilung der Ordnungsmäßigkeit in Schätzungsfällen. Mit dem Zauberwort der „Plausibilität“ lassen sich im Steuerrecht Fehler leicht vertuschen, weshalb man bei der Verwendung dieses Begriffs argwöhnisch sein sollte. Allgemein lässt sich folgern, dass in hochsensiblen und hochbedeutsamen Bereichen Plausibilisierungen keinen Raum haben und durch fachlich seriöse Gegenrechnungen und Untersuchungen ersetzt werden sollten.
Wenn eine Analyse zum Ergebnis führt, dass vernünftigerweise mehrere Verwendungsmöglichkeiten des Objektes möglich sind, ist die Finanzierungsfähigkeit der einzelnen Alternativen zu prüfen. Nach IVS leitet sich der HABU in finaler Weise vom Ergebnis her ab: „The use that results in the highest value, in keeping with the other tests, is the highest and best use”, § 6.4 GAVP.
Schließlich gehen die GAVP in § 6.6 auf Marktsituationen mit hoher Volatitlität ein: „The highest and best use of a property may be a holding for future use.“ Im Umkehrschluss ist zu folgern, dass bei Marktsituationen ohne hohe Volatilität dies anders zu sehen ist. In anderen Fällen, bei denen mehrere potentielle Arten des HABU identifizierbar sind, sollte der Bewerter diese alternativen Verwendungsmöglichkeiten im Gutachten erörtern und insbesondere das Level der künftigen Einnahmen- und Ausgaben bedenken.
„Plausibilisierung“ ist ein Instrument der juristischen Rhetorik. Ziel ist ausschließlich die Erlangung der Zustimmung anderer für den eigenen Standpunkt. Bei
Schätzungen bezieht sich der „eigene Standpunkt“ auf das vom Betriebsprüfer präsentierte Primärergebnis, welches der Besteuerung zu Grunde gelegt werden soll.
Die Verwendung des Plausibilitätsbegriffs ist facettenreich. Im Grunde geht es bei Schätzungen durch Betriebsprüfer um das Signal an den/die Adressaten, das gefundene Ergebnis habe sich bei einer Nachprüfung als zutreffend herausgestellt, also begegnen dem Schätzungsergebnis keine Bedenken. Insoweit stellt die bloße Behauptung, das Primärergebnis sei „plausibel“, ebenso wenig ein (zusätzliches) Beweismittel für die Erfüllung der dem Finanzamt obliegenden Feststellungslast dar, wie die Bezugnahme auf eine bereits erfolgte ergänzende Berechnung. Zumindest sollte zur Verdeutlichung in einem derartigen Kontext eingeräumt werden, dass es nicht um „Wahrheit“ in Bezug auf Erfahrungstatsachen bzw. um „Richtigkeit“ in Bezug auf normative Aussagen, sondern ausschließlich um die Zustimmung anderer zur eigenen Berechnung des Betriebsprüfers geht.
Die Rechtsprechung ist mit der Vorgehensweise bzgl. einer Plausibilisierung nicht immer und häufig nur scheinbar an einer Qualitätssicherung interessiert. Bisweilen erspart sie sich die Qualitätsprüfung, denn ihre Aufgabe wäre es, die Geeignetheit der Methode und die Korrektheit der Anwendung im konkreten Fall zu prüfen. Stattdessen nimmt sie in diesen Fällen eine Plausibilisierung vor, die den Wahrheitsgehalt nicht wirklich aufklären kann, weil sie auf Oberflächlichkeit und Scheinlogik basiert sowie auf Prämissen aufbaut, die falsch sein können, z. B. durch Anknüpfung an den erklärten Umsatz, der ja falsch sein soll.
IneinigenEntscheidungenistdieRechtsprechungeinen Schritt weiter gegangen und stellt weniger die Plausibilisierung als vielmehr den Prüfungsaspekt heraus. Insoweit wird von Plausibilisierungsprüfung – so z. B. vom BFH im Zeitreihenurteil – gesprochen. Hierbei liegt der Schwerpunkt auf der Nachprüfung des Schätzungsergebnisses nach Maßgabe einer zweiten, von der ersten unabhängigen Berechnung und weniger auf der Bedeutung einer Plausibilisierung im ursprünglichen Wortsinn als eine auf den „Beifall“ des Adressaten ausgerichtete rhetorische Figur. Die Plausibilitätsprüfung ist – laut BFH – von Amts wegen durchzuführen. Dieser Ansatz ist zu begrüßen. Er liegt auf einer Linie mit der Forderung nach mehr substantiellem Gewicht sowie Transparenz und dem Streben nach mehr Objektivität und Wahrheit und distanziert sich von der Absicht, die Plausibilisierung rhetorisch einzusetzen, um höhere Überzeugungskraft für die eigene Position zu erlangen. Die Analyse von bisherigen finanzgerichtlichen Entscheidungen zeigt hingegen weiterhin den anpassungsfähigen Umgang mit dem Begriff „Plausibilität“. Soweit hierdieVornahmeeinerPlausibilisierungalsBeweismittel oder als Argument ohne Begründungstiefe erachtet wird, kann dem nicht gefolgt werden.
Der Begriff „Plausibilisierung“ kann im Rahmen von Schätzungen fünf Funktionen erfüllen: Scheinargumentations-, Begründungs-, Unterstützungs-, Überprüfungsoder Kontrollfunktion. Nur in der Kontrollfunktion würde sich für den Steuerpflichtigen ein Sinn für die praktische Verwendung einer Plausibilisierung, sei es durch den Außenprüfer oder sei es durch den Steuerpflichtigen, erschließen. Im Übrigen ergeben sich für den Steuerpflichtigen Nachteile. Dann sollten diese Funktionen und Restriktionen auch offen kommuniziert werden. Anstelle des Plausibilisierungsansatzes bei Betriebsprüfungen wären daher die Anforderungen an die Begründung und Kontrolle von Mehrergebnissen im Sinne einer Plausibilitätsprüfungundweniger– nureinseitig– dieAnforderungen an die Buchführung und Aufzeichnungen zu erhöhen.
Funktionen | Erläuterung | Sinnhaftigkeit | |
---|---|---|---|
FA | Stpfl. | ||
Scheinargumen- tationsfunktion |
Verwendung als Füllwort oder Worthülse |
ja | nein |
Begründungs- ersatzfunktion |
Erlangung einer Begrün- dungstiefe ist nicht möglich |
ja | nein |
Unterstützungs- funktion |
z. B. primär Nachkalkulati- on, sekundär Richtsätze |
ja | nein |
Überprüfungs- funktion |
Überprüfung der Rachenlo- gik und der Rechenschritte |
ja | nein |
Kontrollfunktion | z. B. primär Nachkalkulation, sekundär Geldverkehrsrech- nung |
ja | nein |
Zurweiteren Charakterisierung und Beurteilung wurden fünf Aspekte beleuchtet, die im Rahmen von Schätzungen dem Begriff „Plausibilitätsprüfung“ zugeordnet werden können, nämlich: Qualität, Genauigkeit, Zeit, Kosten und die Fähigkeit, einen Adressaten zu überzeugen. Steuerpflichtige legen den Schwerpunkt auf Qualität und Genauigkeit. Betriebsprüfer stellen hingegen offen den Zeit- und Kosteneinsparungsaspekt in den Vordergrund, wobei das Bemühen, überzeugend zu wirken und die Erlangung von Zustimmung bisweilen über allem stehen. Plausibilisierungen sind bestätigend und überzeugend sowie ergebnisbezogen vorgeprägt; Plausibilitätsprüfungen sind kontrollierend und vergewissernd sowie ergebnisoffen ausgerichtet.
Um Verwechslungen und Fehlinterpretationen im Umgang mit dem Begriff des Plausibilisierens bei den Schätzungsadressaten zu vermeiden und auch aus Gründen der Fairness sollte der Begriff „Plausibilisierung“ künftig besser ganz vermieden und stattdessen von „Nachprüfungen“ oder „Gegenrechnungen“ (am besten) gesprochen und diese auch (sorgfältig) durchgeführt werden. Dies würde einen Quantensprung an Qualitätsverbesserung in der Außenprüfung bedeuten.
Forderungen zur Qualitätsverbesserung von Schätzungen:
* Nachprüfungen nur nach Maßgabe der Kontrollfunktion
* UnabhängigeGegenrechnungdurcheine‚geeignete‘Schätzungsmethode
* Erhöhung der rechtlichen Voraussetzungen für die Verneinung der Möglichkeit einer Gegenrechnung
* Sicherheitszuschläge haben keine Kontrollfunktion, keine theoretische Fundierung und besitzen keine Ausrichtung an Wahrscheinlichkeiten
* Senkung der rechtlichen Hürden für die Annahme von Willkür bei der Verwendung von Sicherheitszuschlägen
* Höhere Ansprüche an die Begründungstiefe für die Schätzungshöhe
Es gibt durchaus absurde, viel zu niedrig aufgezeichnete Kasseneinnahmen von Steuerpflichtigen; es gibt aber auch durchaus absurde, viel zu hoch „berechnete“ und „plausibilisierte“ Mehrumsätze und -gewinne seitens der Betriebsprüfer. Im Ergebnis bringt die Verwendung von Plausibilisierungen abgesehen von der Kontrollfunktion, die in der Praxis der Außenprüfung aber so gut wie nie zum Tragen kommt, für den Steuerpflichtigen keinen Nutzen, eher versteckte Nachteile und macht daher keinenSinn.41 „Plausibilisierung“ ist eine rhetorische Figur, hingegen „Plausibilitätsprüfung“ als Forderung des BFH ein Muss bei Schätzungen. Bei diesen ist nach den Erfahrungen des Verfassers festzustellen: Was plausibel erscheint, ist nur selten auch wahr. Das wusste übrigens schon Johann Wolfgang von Goethe, der im Deutschen Wörterbuch der Gebrüder Grimm mit den Worten zitiert wird: „wer die menschen betrügen will, musz vor allen dingen das absurde plausibel machen.“
Bei Verstößen gegen die § 158 AO genannten Einzelvorschriften droht, egal es sich um einen Kleinstbetrieb oder um einen Konzern handelt, die Verneinung der Beweiskraft der Buchführung. Dabei ist in ständiger Rechtsprechung das "sachliche Gewicht" dieser Verstöße maßgeblich. Zusätzlich wird in § 158 AO auf die Einzelbezogenheit entsprechend den jeweiligen individuellen "Umständen" abgestellt. Ergänzend ist gem. § 88 AO die Gesamtbetrachtung "aller" Umstände zu beachten. Da es sich bei den berücksichtigungspflichtigen "Umständen" um einen unbestimmten Rechtsbegriff handelt, wäre es hilfreich, wenn eine Methode durch Messung und Visualisierung eine Nachvollziehbarkeit für das Verwerfen oder Nichtverwerfen der Beweiskraft der Buchführung bewirken könnte. Dieses Problem könnte durch den Skalierungsansatz - ähnlich wie bei der Abschlussprüfung - nebst Verwendung der Multidimensionalen Skalierung (MDS) gelöst werden.
§ 158 AO besagt: „Die Buchführung und die Aufzeichnungen des Steuerpflichtigen, die den Vorschriften der §§ 140 bis 748 entsprechen, sind der Besteuerung zugrunde zu legen, soweit nach den Umständen des Einzelfalls kein Anlass ist, ihre sachliche Richtigkeit zu beanstanden"2 Wird im Rahmen einer Außenprüfung untersucht, ob die Buchführung den in § 158 AO genannten Einzelvorschriften entspricht, gilt ergänzend der allgemeine Untersuchungsgrundsatz gem. § 88 Abs. 1 Satz 2 AO: “Dabei hat sie [die Finanzbehörde] alle für den Einzelfall bedeutsamen, auch die für die Beteiligten günstigen Umstände zu berücksichtigen."3 Üblicherweise wird wegen des Tatbestandsmerkmals “alle" von der Beachtung der Gesamtumstände bzw. von dem Gesamtbild der Verhältnisse gesprochen.
Die in § 158 AO normierte Regelvermutung der Beweiskraft einer Buchführung ist für die kleineren und mittleren Unternehmen von zentraler Bedeutung, wird doch in letzter Zeit mit stark steigender Tendenz die Befugnis der Finanzbehörden, die Besteuerungsgrundlagen nach § 162 A0 zu schätzen, gerade bei Außenprüfungen mit dem Schwerpunkt bei inhabergeführten, bargeldintensiven Betrieben regelmäßig mit dem Hinweis darauf begründet, dass wegen Verstößen gegen §§ 140 bis 148 AO die geprüfte Buchführung nicht ordnungsgemäß i.S.v. § 158 AO sei. Daher greife die Beweiskraftvermutung nicht und somit sei der Weg für eine Schätzung geebnet, da nach dem Wortlaut des § 162 AbS. 2 Alt. 2 AO “insbesondere dann" zu schätzen ist, „wenn die Buchführung oder die Aufzeichnungen der Besteuerung nicht nach § 158 zugrunde gelegt werden“.
Da sich bei bargeldintensiven Betrieben aber immer irgendein Mangel und meist sogar eine Vielzahl von Mängeln finden lässt - es kommt nur auf die Zeitdauer und die Intensität [116] der Prüfung sowie den flexiblen Umgang mit den Mitwirkungspflichten des Steuerpflichtigen an -, sind die Auswirkungen drastisch: So führt Achilles aus, dass “in bargeldintensiven Betrieben, so zeigt die Praxis, ... mehr als 90% der Außenprüfungen in der Schätzung von Besteuerungsgrundlagen" enden.4 Teutemacher nimmt an, dass sogar in 95 % der Fälle die Kassenführung verworfen wird.5 Nach Kalischke wird die Kassenführung - ebenfalls - in 95 % der Fälle verworfen.6 Nach den Erfahrungen des Verfassers auf Grund von Befragungen im Kölner Raum wird in bestimmten Branchen wie Eisdielen, Imbissen oder Restaurants die Buchführung in nahezu 99 % als nicht ordnungsgemäß angesehen mit der Folge eines hohen Anteils von nachfolgenden Vollstreckungshandlungen und Insolvenzen für die betroffenen Betriebe. Streitfälle nach einer Außenprüfung betreffen nach Pump 25 % bzw. bei einzelnen Finanzgerichten 30 % aller Verfahren, und zwar mit steigender Tendenz.7 Der Grund hierfür liegt nach Einschätzung des Verfassers in der einseitigen Fokussierung auf die in § 158 AO genannten Einzelvorschriften und der Vernachlässigung der Würdigung der dort genannten Umstände des Einzelfalls. Dies geht einher mit verfestigten, vereinfachenden, schematischen Handlungsmustern der Prüfer, die eine Widerlegung der Beweiskraft der Buchführung erleichtern, aber mitunter im Widerspruch zum Sinn und Zweck des § 158 AO in Bezug auf die dort eingeforderte Einzelfallbezogenheit stehen.
1 Der Verfasser ist selbständiger Steuerberater in Köln.
2 Fettdruck durch den Verfasser.
3 Die vorstehend in Fettdruck angeführten Tatbestandsmerkmale (Fettdruck durch den Verfasser) spielen bislang weder in der Praxis noch in der Literatur eine besondere Rolle; z.B. in den AO-Kommentaren Hübschmann/Hepp/Spitaler, Klein, Kühn/Wedelstädt, Pahlke/Koenig sowie Tipke/Kruse zu § 158 AO bleiben diese Tatbestandsmerkmale unkommentiert.
4 Achilles, Kassenführung in bargeldintensiven Unternehmen, 2014, S. 251.
5 Teutemacher, Handbuch zur Kassenführung, 2015, S. 2.
6 Kalischke, Betriebe bangen vor Steuerprüfern - Verbände kritisieren: Kassenführung wird bei 95 % der Unternehmer verworfen, Westfälische Nachrichten vom 15.3.2014, S. 8.
7 Vgl. Pump, Die offene Ladenkasse mit Kassenbericht im bargeldintensiven Betrieb, StBp 2017 S. 84 ff.
Es wird in § 158 AO nicht zwischen formellen und materiellen Mängel der Buchführung differenziert. Zwar handelt es sich bei den Vorschriften der §§ 140 bis 148 AO vielfach um Formvorschriften, von besonderer Bedeutung ist jedoch die materiellrechtliche Vorschrift des § 146 Abs. 1 Satz 1 AO, wonach die Buchungen und Aufzeichnungen u.a. „vollständig" und „richtig" vorzunehmen sind. Werden Einnahmen nicht vollständig aufgezeichnet, stellt dies ebenso einen materiellen Mangel dar wie z.B. die unrichtige Aufzeichnung von Außerhauslieferungen in der Gastronomie. Mängel erschüttern die Beweiskraft aber nur, wenn sich durch diese (gewichtige) Zweifel an der sachlichen Richtigkeit der Buchführung ergeben und diese dann gem. § 158 AO zu “beanstanden" ist.8 Das ist unausweichlich weder bei jedem einzelnen Mangel noch mehreren Einzelverstößen gegeben.9 Entscheidend für die Widerlegung der Beweiskraftvermutung ist das sachliche Gewicht der insgesamt festgestellten Mängel,10 also welche Bedeutung die Mängel für die Beurteilung der Buchführung als Ganzes haben.11 Der Begriff "sachliches Gewicht" ist gesetzlich weder normiert noch definiert und knüpft als unbestimmter Rechtsbegriff an “Gewichtung", was ein gewisses Maß an Bedeutung und Teilhabe an der Gesamtheit voraussetzt, sowie an die „sachliche" Bezugsnorm, also die Buchführung als Grundlage für die Herleitung von Besteuerungsgrundlagen, an. Die Beurteilung der “Gewichtung" hängt dabei denknotwendig wegen des Tatbestandsmerkmals „alle" von der Kenntnis der Gesamtheit der erfüllten und der nicht erfüllten Buchführungspflichten ab. Geringes sachliches Gewicht haben nach der Rechtsprechung jedenfalls formelle Mängel in Unternehmen, die weniger als 10 % ihrer Umsätze bar vereinnahmen, wenn keine weiteren gravierenden Mängel auftreten. 12 Häufig sind aber weder den Prüfungsberichten noch den Einspruchsentscheidungen diese Gesamtheit zur Beurteilung des sachlichen „Gewichts" und des damit verbundenen Gesamtbilds der Verhältnisse zu entnehmen.
Es gibt keine festen Regeln bezüglich der zur Beweiskraftverneinung erforderlichen Menge der festgestellten Mängeln. Im Rahmen der Gesamtbeurteilung der Buchführung kann bereits ein einziger schwerer Mangel (z.B. Nichterfassung einer hohen Einnahme) die Beweiskraft verneinen, andererseits muss eine Vielzahl von (z.B. formellen) Verstößen nicht zwingend zum selben Ergebnis führen. So propagierte ein Ausbilder von Betriebsprüfern im Kölner Raum das Suchen möglichst vieler Fehler, auch kleinerer und kleinster Fehler (so wörtlich: „Korinthen“), die dann durch die Vielzahl im späteren Verlauf den Eindruck einer nicht beweiskräftigen Buchführung entstehen lassen würden.
Die Differenzierung zwischen formellen und materiellen Fehlern ist aber von Bedeutung wegen der Beurteilung der Schwere der Mängel (leicht - gravierend). Dabei unterscheidet die FinVerw mehrere Extremfälle, indem sie auf den Begriff der „Wesentlichkeit" i.V.m. der Fehlerart formell/materiell abstellt: „Enthält die Buchführung formelle Mängel, ist ihre Ordnungsmäßigkeit [regelmäßigj nicht zu [S. 117] beanstanden, wenn das sachliche Ergebnis13 der Buchführung dadurch nicht beeinflusst wird. Enthält die Buchführung materielle Mängel... , wird ihr [S. 316] e Ordnungsmäßigkeit dadurch nicht berührt, wenn es sich dabei um unwesentliche Mängel handelt“ (R 5 Abs. 2 [StR 2012 zu § 5 EStG]). Auf der anderen Seite stellt Nr. 122 AEAO zu § 158 die Konsequenzen klar, wenn sich die Buchführung „in wesentlichen Teilen" als unbrauchbar erweist (keine Beweiskraft der Buchführung nebst Vollschätzung).14 Dabei kann der Begriff „wesentlich" mit dem Begriff „schwerwiegend" bzw. “zum Kern gehörend" gleichgesetzt werden, zumal das o.g. Erfordernis der Gewichtung denknotwendig einen Abwägungsprozess (also Darstellung der Argumente pro und contra) erfordert. Dieser Abwägungsprozess ist bei der Annahme, die Beweiskraft der Buchführung sei erschüttert, nachvollziehbar darzustellen und die Verneinung der Richtigkeitsvermutung des § 138 AO wegen der zum Teil fatalen Folgen eingehend zu begründen. In derartigen Fällen stellt der BFH neuerdings auf das Vorhandensein einer ausreichenden „Begründungsriefe" ab. 15 Je fataler die Folgen sind, umso höher sind die Anforderungen an die Begründungstiefe. Dieser Abwägungsprozess ist von der Finanzbehörde verpflichtend in der Schlussbesprechung gem. § 201 Abs. 1 Satz 2 AO, im Bp-Bericht gem. § 202 Abs. 1 Satz 2 AO und in der Einspruchsentscheidung gem. § 366 AO darzustellen. Auch in FG-Entscheidungen würde es der gesetzlich geforderten Einzelfallbetrachtung dienen, wenn anstelle der vierfach verwendeten Zwei-Satz-Begründungen 16 ein fallbezogener Abwägungsprozess mit Begründungstiefe erkennbar wäre.
. BFH vom 26.8.1975, VIII R 109/70
Beweiskraft gegeben, obgleich keine Führung eines Kontokorrent-Sachkontos über den unbaren Geschäftsverkehr bei entsprechender Ausgestaltung der Rechnungsablage erfolgte. Bei Mängeln der Inventur, Kassenführung und chronologischen Verbuchung kommt es auf ihr sachliches Gewicht im Rahmen des gesamten Buchführungswerks an. Wird die Überprüfung des sachlichen Ergebnisses durch Buchführungsmängel nicht wesentich beeinträchtigt, so kann im Allgemeinen bei überschaubaren Verhältnissen kleinerer Betriebe die Ordnungsmäßigkeit der Buchführung bejaht werden.
BFH vom 7.7.1977, IV R 205/72
Das sachliche Gewicht ist auch für die nicht zeitnahe Verbuchung von Kassenausgaben maßgeblich. Werden unmittelbar nach Auszahlung der Tageskasse Einnahmen und Ausgaben in das Kassenbuch übertragen, so brauchen die Notizzettel mit dem Auszählungsergebnis nicht als Einnahmeursprungsaufzeichnungen aufbewahrt zu werden. Die von der Rechtsprechung zugelassene Beiegsammlung als hinreichender Grundbuchersatz bei kleinen Betrieben kommt auch in Betracht, wenn bei überschaubaren Verhältnissen die Möglichkeit nachträglicher Manipulationen ausgeschlossen werden kann. Der BFH betonte ergänzend, es solle „nicht kleinlich" verfahren werden, wenn „kontrollierbar gewährleistet" sei, dass „alle Belege verbucht" wurden.
BFH vom 26.10.1994, X R 114/92
Bei versehentlichen Nichtbuchungen könne mitunter von keinem schwerwiegenden Mangel der Buchführung ausgegangen werden, wenn sie zeitnah korrigiert würden.
BFH vom 7.6.2000, Iii R 82/97
Trotz nur vierteljährlich ermitteltem Kassenbestand und fehlenden Belege für 90 % der Bargeldeinnahmen und nicht vorliegender Verträge für Versicherungsprovisionen eines Dolmetschers, aber täglich geführtem Kassenbuch, bejahte der BFH in seinem Revisionsurteil die Beweiskraft der Buchführung. Der Einwand des FA, der Kläger habe für über 90 % der Bareinnahmen keine Belege vorlegen können, sei im Streitfall unschädlich. Da in der Vorinstanz weder Kassenfehlbeträge festgestellt wurden noch aus dem angefochtenen Urteil entnommen werden konnte, dass es sich um erhebliche bare Umsätze handelt (nur etwa 10 v.H. der gesamten im jeweiligen Streitjahr erfolgten Einnahmen), könne den fehlenden Belegen ein sachliches Gewicht für die Nichtordnungsmäßigkeit der Buchführung nicht beigemessen werden.
FG Köln vom 27.1.2009, 6 K 3954/07
Die fehlende Aufbewahrung von nur gelegentlich angeforderten Bewirtungsrechnungen in einer Speisewirtschaft ist ein Verstoß gegen § 147 Abs. 1 Nr. 3 AO, welcher der Buchführung aber nicht die formelle Ordnungsmäßigkeit i.S.v. § 158 AO nimmt.
FG Berlin-Brandenburg vom 25.2.2009, 5 K 5221/05
Beweiskraft nicht erschüttert, wenn FA keine ausreichenden Feststellungen für die „sachliche Fehlerhaftigkeit" der Buchführung trifft. Die “Nachkalkulation muss alle Umstände berücksichtigen".
FG Sachsen vom 26.10.2017, 6 K 841/15
Beweiskraft gegeben, obgleich an zwei aufeinander folgenden Tagen für die Endsummenbons dieselbe Nummer vergeben wurde, die Fehlfunktion der Kasse nicht aufgeklärt wurde und Endsummenbons für zwei Wochen nicht vorliegen.
FG Köln vom 7.12.2017, 15 K 1122/16
Eine nicht lückenlos fortlaufende Rechnungsnummernvergabe ist gesetzlich nicht vorgeschrieben, daher ist eine falsche Nummernfolge kein formeller Mangel.
Leider wird häufig der Abwägungsprozess bezüglich des sachlichen Gewichts umgangen, indem die Außenprüfung auf einen einzigen Mangel unter Hinweis auf die Rechtsprechung abstellt. So hatte z.B. der X. Senat des BFH im Zeitreihenurteil als Obiter Dictum postuliert: „Bei einem programmierbaren Kassensystem stellt das Fehlen der aufbewahrungspflichtigen Betriebsanleitung sowie der Protokolle nachträglicher Programmänderungen einen formellen Mangel dar, dessen Bedeutung dem Fehlen von Tagesendsummenbons bei einer Registrerkasse oder dem Fehlen von Kassenberichten [S. 118] bei einer offenen Ladenkasse gleichsteht“. 17 Hiernach wurde von Außenprüfern gleich massenweise die Schätzungsbefugnis abgeleitet mit einem hohen Anteil nachfolgender Vollstreckungsmaßnahmen und lnsolvenzgefährdungen bei den betroffenen Betrieben. Nunmehr ist der BFH im Beschluss vom 11.1.2017 zurückgerudert: „Das Gewicht des Mangels der fehlenden Programmierprotokolle tritt ... zurück, wenn der Steuerpflichtige für den konkreten Einzelfall darlegt, dass die von ihm verwendete elektronische Kasse trotz ihrer Programmierbarkeit ausnahmsweise keine ManipuIationsmöglichkeiten eröffnet.... Erst wenn das FG aufgrund dieses Vortrags Zweifel an der konkreten Manipulation der Registrierkasse hat, wird es verpflichtet sein, die Kasse (gutachterlich) untersuchen zu lassen. In einem solchen Fall wäre es fehlerhaft, allein aufgrund der fehlenden Organisationsunterlagen von einer formell nicht ordnungsgemäßen Kassenführung auszugehen.” Der BFH fokussiert nunmehr zutreffend auf die Umstände des Einzelfalls (hier: konkrete Manipulation) und auf die Abwägung bezüglich des Gewichts des festgestellten Mangels.
8. Vgl. BT-DruckS. VI/1982, S. 146.
9. Dass nicht jeder Verstoß gegen eine Einzelvorschrift der §§ 140 bis 148 AO unabhängig von seinem Gewicht für die Gesamtbuchführung automatisch die Ordnungsmäßigkeit der Buchführung und damit ihre Beweiskraft in Frage stellt, ergibt sich bereits aus dem Wortlaut des § 158 AO, denn § 158 AO knüpft die Beweiskraftvermutung daran, dass die Buchführung und die Aufzeichnungen des Steuerpflichtigen den Vorschriften der §§ 140 bis 148 AO „entsprechen“. Im Kontext zu den anderen Tatbestandsmerkmalen bedeutet im Hinblick auf das Anforderungsniveau an die Buchführung der Begriff “entsprechen” weniger als etwa die Begrifflichkeit „vollständig übereinstimmen”, jedoch mehr als der Begriff „ähneln", womit einsichtig ist, dass einerseits in § 158 AO eine akribische Anbindung an den exakten Wortlaut der jeweiligen Einzelregelungen der §§ 140 bis 148 A0 vom Gesetzgeber gerade nicht intendiert ist, aber andererseits ein höherer Grad an Ähnlichkeit gefordert wird. Zu denken ist an den Begriff „Kongruenz” (congruere, lat. entsprechen). Im Ergebnis führt dies zu einer gesetzlich gewollten Anpassung der sonst recht starren Regelungen zur Buchführung. Dabei mag der eine Rechtsanwender den Schwerpunkt der Beurteilung auf die einzelnen Rechtsvorschriften der §§ 140 bis 148 AO legen und der andere auf die Umstände des Einzelfalls. Was dabei unter den hierzu berücksichtigenden „Umständen“ zu verstehen ist bzw. wie diese zu würdigen sind, ist nicht geklärt und als unbestimmter Rechtsbegriff auslegungsfähig.
10 BFH vom 7.7.1977, IV R 205/72, BStBI II 1978 S. 307, vom 4.8.2010, X B 19/10, BFH/NV 2010 5.2229; vgl. auch Apitz, DStR 1985, S. 304; BFH vom 7.6.2000, III R 82/97, HFR 2001 S. 30.
11 BFH vom 26.8.1975, VIII R 109/07, BStBl II 1976 S. 210.
12 BFH vom 7.6.2000, III R 82/97, HFR 2001 S. 30, Rz. 29.
13 Das sachliche Ergebnis bezieht sich auf Besteuerungsgrundagen (Gewinn, Umsatz).
14 Man kann diese Regelungen als Skalierungshnweise betrachten, auch wenn der Ähnlichkeitsansatz fehlt. Es wäre von Vorteil, wenn weitere Regelungen zu Gunsten der Steuerpflichtigen vorlägen, weil damit mancher übermotivierte Außenprüfer und Sachgebietsleiter gebremst würde.
15 Vgl. BFH vom 20.3.2017, X R 11/16, BStBI II 2017 S. 1812, Rz.50, entsprechend dem Grundgedanken in Rz. 52 muss es dabei möglich sein, zu überprüfen, ob nach sachfremden Erwägungen oder gar willkürlich verfahren wurde.
16 Vgl. Barthel, Stbg 2017 S. 321 (Übersicht 4).
17 BFH vom 25.3.2015, X R 20/13, BStBl II 2015 S. 743, Leitsatz 5.
18 BFH vom 11.1.2017, X B 104/16, BFH/NV 2017 S. 561, Rz. 37.
Außenprüfer legen in der Interpretation des § 158 AO zur Erlangung der Schätzungsbefugnis den Schwerpunkt auf die dort genannten Einzelvorschriften der §§ 140 bis 148 AO; Steuerpflichtige hingegen legen den Schwerpunkt eher auf die (besonderen) Umstände ihres Unternehmens. Außenprüfer versteifen sich nach den Erfahrungen des Verfassers darauf, einseitig im Prüfungsbericht - zum Teil seitenweise - Einzelvorschriften, BMF-Erlasse und Gerichtsentscheidungen, insbesondere zur Kassenführung, zu zitieren mit dem Hinweis darauf, dass diese im zu beurteilenden Falle nicht oder nicht ganz erfüllt sind bzw. gegen diese verstoßen wurde, auf jeden Fall aber gravierend sind (Folge: Schätzungsbefugnis). Eine relevante Einzelvorschrift im Bereich Kassenwesen wird dabei uneingeschränkt auf einen Eisverkäufer mit Bauchladen, der im Sommer alle 14 Tage durch ein Stadion geht, genauso angewendet wie auf einen Lebensmitteleinzelhandelsfilialbetrieb mit einigen 1 000 Filialen und großer lT-Abteilung. Steuerpflichtige verweisen hingegen auf eine Vielzahl einzubeziehender Besonderheiten ihres individuellen Einzelfalls, die man berücksichtigen müsse, die dann aber fast regelmäßig vom Außenprüfer ignoriert werden.9 Die Außenprüfer befinden sich wegen der Hinweismöglichkeit auf den Wortlaut einschlägiger Einzelregelungen auf vermeintlich sicherem Boden, die Steuerpflichtigen wegen der Unbestimmtheit der berücksichtigungsfähigen möglichen Umstände20 des Einzelfalls21 und wegen der Beurteilung der sachlichen Gewichtung eher auf schwammigem Terrain. Der Grund liegt darin, dass es für die in § 158 AO eingeforderte Einzelfallgerechtigkeit bei der Beurteilung der Beweiskraft einer Buchführung bislang weder objektive Vergleichsmaßstäbe noch verlässliche Anhaltspunkte gibt.
Legt man die Tatbestandsmerkmale in § 158 AO „nach den Umständen des Einzelfalls" wörtlich aus, ist im Rahmen der Beweiskraftbeurteilung auf jeden Fall eine Einzelfallbetrachtung erforderlich. Dass dies in der Praxis von Prüfern ignoriert wird, hängt mit der Tendenz zusammen, im späteren Ablauf Prüfungsmethoden anzuwenden, die nicht an individuellbetriebsinterne Daten, sondern an eine „Vielzahl von Fällen" (insbesondere Richtsätze, Sicherheitszuschläge in vergleichbaren Fällen) anknüpfen. Legt man hingegen die o.g. Tatbestandsmerkmale teleologisch aus, führt dies zur Forderung nach Einzelfallgerechtigkeit, was mehr Sinn macht, wenn man sich die Rechtsnormen in der AO vor Augen führt, bei denen der Gesetzgeber ebenfalls die Einzelfallbetrachtung explizit vorgeschrieben hat. Im o.g. Beispiel des Fehlens von Organisationsunterlagen wie Betriebs- bzw. Bedienungsanleitung, insbesondere bei einer, preiswerten Registrierkasse von einem Großhandelsmarkt, wäre es unter dem Gesichtspunkt der Einzelfallgerechtigkeit nicht nachvollziehbar, deshalb die Beweiskraft der Buchführung in Frage zu stellen.22 Die differenzierenden Entscheidungen der Rechtsprechung lassen nicht erkennen, wie genau die Gesamtbewertung der Einzelumstände vorzunehmen ist, nach welchen Kriterien die relevanten Umstände gegeneinander abzuwägen und zu gewichten sind, um am Ende zur Entscheidung zu kommen, ob die Buchführung insgesamt ordnungsmäßig und damit beweiskräftig ist.
Beurteilungskriterien bei der Gesamtwürdigung sind:
1. Art der Fehler (formell/materiell)
2. Barzahlungsanteil/Bankzahlungsanteil
3. Effektivität inner- und außerbetrieblicher Kontrolle
4. Eigen-/Fremdgeschäftsführung
5. Fehlermotiv (absichtlich, absichtslos)
6. Gewinnauswirkung (umschichtend/endgultig)
7. Häufigkeit der Fehler (wenig/viel)
8. Klarheit/Unklarheit von Vorschriften
9. Schwere der Fehler (leicht/gravierend)
10. Stabilität des Buchführungssystems
11. Unternehmensgröße (klein/groß)
12. Verhältnismäßigkeit
[S. 119] Schwere und Art der Fehler sind eng korreliert. Je größer die Überregelung und damit die Unübersichtlichkeit von Vorschriften im
Kassen- und Buchführungsbereich wird, umso mehr steigt das Skalierungserfordernis. Tankstellen-, Fastfood- und Franchisebetriebe unterliegen oft einer strengen außerbetrieblichen Kontrolle. Gerade in dem Bereich der Anforderungen an die Ordnungsmäßigkeit der Buchführung, speziell bezüglich der Kassenführung, wird eine Gesamtbeurteilung überlagert von einer einseitigen Darstellung einer Vielzahl von Einzelverstößen unter Zuhilfenahme von vorgefertigten Textbausteinen, die einer Einzelfallbezogenheit im Grunde entgegenstehen.23 § 88 AbS. 1 Satz 2 AO normiert als verfahrensleitenden Maßstab, dass die Finanzbehörde „alle für den Einzelfall bedeutsamen, auch die für die Beteiligten günstigen Umstände zu berücksichtigen"24 hat. Wenn aber der Gesetzgeber expresbis verbis auf „die Umstände des Einzelfalls"25 sowie sogar auf „die für die Beteiligten günstigen Umstände" hinweist - was bei der Masse der Steuerrechtsnormen sonst nicht der Fall ist -“ ist dies eher eine Ausnahme mit der Konsequenz, dass der Gesetzgeber dem eine besondere Bedeutung zubilligt. Während die gem. § 88 AbS. 1 Satz 2 AO zwingend zu berücksichtigenden Umstände die Handlungs -und Vorgehensweise des Rechtsanwenders bzw. der beurteilenden Person beschreiben, bietet der (eher weiche) Begriff „entsprechen" in § 158 AO i.V.m. den Einzelvorschriften in §§ 140 bis 148 A0 26 via Anpassung das flexible rechtliche Instrumentarium für die Gesamtbeurteilung einer Buchführung. Die zwei Leitplanken in diesem gesetzlichen Rechtsrahmen sind somit „Einzelvorschrift" einerseits und „Einzelfall" andererseits.27
19 Das Problem liegt darin, dass letztlich die Finanzbehörde entscheidet, was „bedeutsam" i.S.v. § 88 Abs. 1 Satz 2 AO ist. Gegen die Ablehnung einer vom Steuerpflichtigen beantragten Berücksichtigung gibt es keinen Rechtsbehelf.
20 Der Begriff Umstände“ sollte im konkreten Einzelfall möglichst präzisiert werden, z.B. mit charakteristischen Eigenschaften wie „außere, „innere", „sachliche", „fachliche „ „rechtliche, „biIdungsbezogene“, „familiäre", „religiöse", „wissensmäßige“, „zeitbezogene“ usw. In der Prüfungspraxis wird die Vielzahl der in § 158 AO genannten Einzelvorschriften häufig undifferenziert nach den „Umständen“ des Unternehmers bzw. des Unternehmens angewendet.
21 Es erweist sich als Nachteil für die Steuerpflichtigen, dass die Anforderungen an die Buchführung in Einzelvorschriften gem. §§ 140 bis 148 A0 nebst unzähligen Erläuterungserlassen und -schreiben detalliert normiert sind, hingegen die Vielzahl möglicherweise zu berücksichtigender Umstande des Einzelfalls nirgendwo fixiert ist bzw. es sich um einen unbestimmten Rechtsbegriff handelt und auch eine Operationaliserung nicht erkennbar ist.
22 Das Fehlen einer Bedienungsanleitung wird in der Außenprüfung häufig zu einem Popanz aufgebauscht. Wird diese dann im Nachhinein doch gefunden, ist es frustrierend, wenn der Prüfer oder ein Finanzgericht dann lediglich einen Haken in einer Checkliste macht und sich inhaltlich nicht weiter mit dieser beschäftigt. Das Gleiche dürfte gelten, wenn dem Betriebsprüfer die Erstprograrnmierung einer Registrierkasse tatsächlich ausgehändigt werden kann.
23 Vgl. Barthel, Schätzung aufgrund von Kassenmängeln, StBp 2016 S. 80. Zum Erfordernis einer Abwägung und einer Gesamtbewertung gibt es eine Parallele, und zwar zur Beurteilung der Ordnungsmaßgkeit eines Fahrtenbuchs. Auch hier stellt der BFH auf den quantitativen und qualitativen Aspekt (“einige“ bzw. „kleinere“ Mängel) ab: „Ebenso wie eine Buchführung trotz einiger formeller Mängel aufgrund der Gesamtbewertung noch als formell ordnungsgemäß erscheinen kann [. . .], führen jedoch auch kleinere Mängel nicht zur Verwerfung des Fahrtenbuchs und Anwendung der 1 %-Regelung, wenn die Angaben insgesamt plausibel sind [. . .]. Maßgeblich ist, ob trotz der Mängel noch eine hinreichende Gewähr für die Vollständigkeit und Richtigkeit der Angaben gegeben und der Nachweis des zu versteuernden Privatanteils an der Gesamtfahrtleistung des Dienstwagens möglich ist“, BFH vom 10.4.2008, VI R 38/06, BStBI II 2008 S. 768.
24 § 88 AO (Amtsermittungsgrundsatz) wurde überdies mit Wirkung ab 1.1.2017 nach dem StModernG zusätzlich zu den bisher genannten Prinzipien der Verhältnismäßigkeit, der Gleichmäßigkeit und der Rechtmäßigkeit um die beiden Prinzipien der Wirtschaftlichkeit und der Zweckmäßigkeit erweitert mit der Folge, dass die Abwägung noch schwieriger geworden ist.
25 Da ein substantiierter Unterschied zwischen den beiden Formulierungen nicht erkennbar ist, wird im Folgenden einheitlich von den „Umständen des Einzelfalls" gesprochen. Es ist aber schon eigenartig, wenn der Gesetzgeber in §
88 AO einseitig - wohl aus gutem Grund - die Finanzbehörden anweist, auch die für den Steuerpflichtigen „günstigen Umstände" zu berücksichtigen.
26 Es erstaunt, dass die Verwerfung einer Buchführung in der Praxis selten mit der Benennung einer der Einzelvorschriften der §§ 140 bis 148 AO begründet wird, sondern in der Hauptsache mit Regelungen in Schreiben und Erlassen sowie gerichtlichen Entscheidungen.
27 Es ist überraschend, dass es eine ausufernde Rechtsprechung zu den genannten Einzelvorschriften, nicht aber zu den zu beachtenden möglichen Umstanden des Einzelfalls gibt.
Als Vorbild für den Abwägungsprozess und die erforderliche Gesamtbewertung könnte das Skalierungskonzept herangezogen werden, welches bereits seit vielen Jahren in den International Standards an Auditing (ISA) und in den IDW-Prüfungsstandards seinen Niederschlag gefunden hatte und seit dem 28.9.2012 ganz offiziell als Muss-Vorschrift von Wirtschaftsprüfern und vereidigten Buchprüfern zu berücksichtigen ist. Dieses Konzept wird als „Skalierter Prüfungsansatz”28 als Ergänzung zum sog. “risikoorientierten Prüfungsansatz" beschrieben und ist in § 24b Abs. 1 BS WP/vBP (Auftragsabwicklung) wie folgt niedergelegt: „WP/vBP haben für eine den Verhältnissen des zu prüfenden Unternehmens entsprechende Prüfungsdurchführung Sorge zu tragen. Dabei hat der WP/vBP Art, Umfang und Dokumentation der Prüfungsdurchführung im Rahmen seiner Eigenverantwortlichkeit nach pflichtgemäßem Ermessen in Abhängigkeit von Größe, Komplexität und Risiko des Prüfungsmandats zu bestimmen.“29 Ein Vergleich zwischen §§ 88, 158 AO und § 24b Abs. 1 BS WP/vBP zeigt, dass die Formulierungen „Umstände des Einzelfalls" in § 158 Alt. 2 AO und "Verhältnisse des zu prüfenden Unternehmens" in der Berufssatzung ähnlich sind. Auch der jeweilige Gesamtbeurteilungsansatz ist ähnlich: Einmal mündet das Ergebnis der Prüfung bei der Wirtschaftsprüfung als Gesamturteil in den Bestätigungsvermerk, der zu erteilen, zu ergänzen oder zu versagen ist, und zum anderen mündet die Gesamtbeurteilung der Prüfung bezüglich der Ordnungsmäßigkeit der Buchführung in die generalisierende Feststellung, ob die Beweiskraftvermutung des § 158 AO vorliegt. Während bei der Skalierten Abschlussprüfung die maßgebenden Kriterien bereits in § 24b BS WP/vBP genannt sind (Größe, Komplexität und Risiko), müssten diese bei einer skalierten Außenprüfung noch gefunden werden. Hierbei kann auf die in Abschn. III genannten Beurteilungskriterien zurückgegriffen werden.
Der Begriff „Skalierte Abschlussprüfung" wird im Erläuterungstext zu § 24b BS WP/vBP dahingehend definiert, dass der Wirtschaftsprüfer sich bei der Durchführung der Prüfung „an den tatsächlichen Gegebenheiten des Prüfungsgegenstandes, namentlich Größe, Komplexität und Risiko, zu orientieren und damit den Grundsatz der Verhältnismäßigkeit zu beachten" hat.30 Eine prägnantere Erläuterung geben Kuhn/Stibi, wonach bei einer Skalierbarkeit „die Einzelregelungen der ISA nach prüferischem Ermessen situationsspezifisch an die individuellen Verhältnisse angepasst werden können".31 Dieser Anpassungsansatz ist auf Außenprüfungen übertragbar. [S. 120]] Wünschenswert wäre eine Visualisierung der Teilergebnisse von Beurteilungen. Ein fremder Dritter (z.B. der Steuerpflichtige oder der Finanzrichter) würde gerne wissen wollen, in welchen Prüfungssegmenten leichte bzw. schwere Mängel mit welcher Häufigkeit und welcher Gewichtung aufgedeckt wurden und wie das Gesamturteil gebildet wurde. Hierzu bietet es sich an, die Analyse der Umstände und Ergebnispräsentation in Anlehnung an die in der Wissenschaft etablierte Multidimensionale Skalierung vorzunehmen.
28 Vgl. ausführlich Freichel, Skalierte Jahresabschlussprüfung, 2016.
29 Fettdruck durch den Verfasser.
30 Zur näheren Charakterisierung können mit dem Begriff Skalierung“ die Termini „Gesamtbetrachtung in Bezug auf die Beweiskraft einer Buchführung“ (anstelle einer Einzelvorschriften-Fokussierung), „Anpassung an individuelle Verhältnisse“, „situationsspezifische Ausrichtung“, „Festlegung von Wesentlichkeitsgrenzen“, „Größe eines noch zu akzeptierenden Fehlers", "Beachtung des Grundsatzes der Verhältnismäßigkeit“, „Orientierung an den tatsächlichen Verhältnissen des Unternehmens“, „Vernachlässigung kleinerer und/oder weniger Fehler“ verbunden werden.
31 Kuhn/Stibi, Änderungen der IDW Prüfungsstandards aufgrund des Bilanzrechtsmodernisierungsgesetzes (Bil-MoG), WPg 2009 S. 1 157.
Die Multidimensionale Skalierung32 ist ein Instrument der Statistik, um bei einem komplexen Phänomen auf der Basis nicht-metrischer Ähnlichkeitsdaten ein metrisch skaliertes Endergebnis zu erzielen. Mehrere Dimensionen können gleichzeitig skaliert werden, so dass erkennbar wird, wie sich die jeweiligen Dimensionen im Verbund auswirken (also keine isolierte Auswirkungsbetrachtung).
Nicht-metrische Daten können in einem konkreten Außenprüfungsfall z.B. sein: Radierungen, Überschreibungen, Lücken in Rechnungsnummern, Fehlen von Z-Bons, von Bedienungsanleitungen oder von Erstprogrammierungsprotokollen, Verwendung einer Excel-Tabelle als Kassenbuch, unvollständige und unrichtige Aufzeichnung von Einnahmen, Nichteinhaltung der Zeitnähe usw., und zwar im Vergleich zu gleichen oder anderen Beanstandungen in ähnlich gelagerten Prüfungsfällen.
Die Multidimensionale Skalierung enthält im abstrakten Modell den metrischen Distanzbegriff und erlaubt damit eine geometrisch räumliche Visualisierung unterschiedlicher Dimensionen von Elementen als Träger von Eigenschaften (Art und Häufigkeit der Mängel, Unternehmensgröße, operative Ausrichtung usw.).33 Damit kann eine Vielzahl von Eigenschaften bzw. Einzelfeststellungen reduziert und in überschaubare Gruppen klassifiziert, d.h. strukturiert werden.
Die Multidimensionale Skalierung ist ein hilfreiches Entscheidungsinstrument auch im juristischen Bereich. Hier hat die Bedeutung von Beurteilungen auf Grund von Messungen gleichermaßen zugenommen. Auch hier gilt das Prinzip: „Was man nicht messen kann, kann man nicht seriös beurteilen”. Wenn ein Entscheider bei der Finanzbehörde oder beim Finanzgericht bei der Gesamtbeurteilung im Blindflug unterwegs ist, kann das nicht hingenommen werden. Die Multidimensionale Skalierung basiert auf dem Konzept der Ähnlichkeit. Aus Ähnlichkeitsurteilen lassen sich wichtige Informationen gewinnen, insbesondere wie eine valide, fundierte und vor allem nachvollziehbare Gesamtbeurteilung eines Phänomens (hier: Beweiskraft einer Buchführung) getroffen werden kann.34 Die Multidimensionale Skalierung vermag eine große Datenmenge unterschiedlich stark miteinander verknüpfter Daten in ihrer Beziehung zueinander und mit ihren Ähnlichkeiten und Gegensätzen per Visualisierung insgesamt besser erkennbar zu machen, als es etwa beim Versuch, die komplexen Zusammenhänge mit Erläuterungstext zu beschreiben, möglich ist. Statt z.B. sechs Seiten über Mängel inklusive Beschreibung, Erläuterung, Rechtsgrund und Beurteilung usw. im Bp-Bericht zu lesen, wäre für die Adressaten eine Tabelle mit Angabe von Beurteilungskriterien wie Vollständigkeit oder Dokumentation in den jeweils relevanten Segmenten einer Buchführung nebst Angabe des jeweiligen Beurteilungsergebnisses für die eigene Urteilsfindung im Zweifel ergiebiger.
Nachfolgend wird skizziert, wie aus einer Vielzahl nichtmetrischer Einzeldaten zur Buchführung eine strukturierte metrische Übersicht abgeleitet werden kann und wie hierauf aufbauend eine Interpretation im Hinblick auf die Gewinnung einer Gesamtbeurteilung bezüglich der Beweiskraft der Buchführung erfolgen kann.
32 Einen guten Überblick bieten z.B. Borg/Staufenbiel, Theorien und Methoden der Skalerung, 1989, m. w. N.; Böckenholt, Mehrdimensionale Skalierung qualitativer Daten - Ein Instrument zur Unterstützung von Marketingentscheidungen, 1989.
33 Es gibt auch berücksichtigungspflichtige Umstände, die einer SkaIierung nicht bzw. weniger gut zugänglich sind, Beispiele: Mängel im Grüdungsjahr, im Zeitablauf geänderte Konkurrenzsituation.
34 Bei den nachfolgenden Darstellungen und Beispielen wurde bewusst auf mathematische Ableitungen und rechentechnische Einzelheiten verzichtet, obgleich sich bei der Umsetzung in der Praxis bei komplexen Einzelsachverhalten bzw. bei einem Einbezug einer Vielzahl vergleichbarer Sachverhalte die Verwendung leistungsfähiger Statistikprogramme wie SPSS, die MDS-Module vorsehen, anbieten könnte.
Die Vielzahl der von einem Außenprüfer angeführten Attribute zur Beweiskraft der vorgefundenen Buchführung werden zweckmäßigerweise strukturiert in eine Matrix eingestellt, die einerseits die Art des jeweiligen Mangels und andererseits die Segmente der Buchführung erfasst. Hinsichtlich der Art des jeweiligen Mangels kann auf die Strukturierung, die der Verfasser bezüglich der Grundsätze einer ordnungsmäßigen Durchführung von Schätzungen - verwendet hat, zurückgegriffen werden (vgl. hierzu die Zeilen in Abb. 1). Dieses Tableau dient als Zwischenschritt zur Reduzierung der Komplexität bezüglich der Vielzahl der möglichen positiven (!) wie negativen Einzelfeststellungen zur Beurteilung der Beweiskraft der Buchfuhrung.36[S. 123]
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Bei einem großen Restaurant wurden folgende Mängel (= nicht-metrische Daten) festgestellt (in der Reihenfolge der Zeilen):
Überträgt man diese Mängel nun in ein strukturiertes Tableau, kann deren Gewicht mittels Schriftgröße und Schriftart visualisiert werden. Die Eintragungen in ein derartiges Tableau sollten stets mit größtmöglicher Kürze und Prägnanz erfolgen. Im Folgenden bedeuten:
• In der Buchführung wurden im Debitorenbereich sehr viele Sammelkonten (z.B. diverse Kunden mit A) verwendet,
• Es fehlten im Prüfungszeitraum einige Z-Bons infolge eines technischen Fehlers an insgesamt 15 Tagen. Diese wurden per Hand aufgezeichnet.
• Es gab Lücken in den fortlaufenden Rechnungsnummern, weil Rechnungen neu geschrieben und die alten Rechnungen nicht aufbewahrt wurden.
• Die Festschreibung der monatlichenBuchführung war in 30 % der Fälle nicht sofort erfolgt.
• Die Kassenaufzeichnung (anhand der Einnahmen- und Ausgabenbelege) wurde durchgehend per Excel erledigt.
• An drei Tagen wurden Kassenfehlbeträge von durchschnittlich 150 € festgestellt.
• Im Rahmen der Abschlussbuchungen wurde bei den unentgeltlichen Wertabgaben für den privat genutzten Pkw ein falscher Listenpreis zu Grunde gelegt.
• Es wurden ergänzend “Umsätze ohne Rechnung” [UoR] d.h. nicht verbuchte Einnahmen festgestellt.
- Tabelle -
Die beschreibenden, nicht-metrischen Feststellungen sind in Beispiel 1 durch die Einstellung in das Tableau bezüglich der Art (formeller oder materieller Mangel) und bezüglich der Schwere im Sinne einer Rohdatenmatrix vorbeurteilt. Zur Überführung in ein metrisches System ist zunächst eine Vorentscheidung über die Art der Skalierung erforderlich. Es bietet sich hierzu eine Punkteskala von 0 bis 9 an (0 = kein Mangel; 9 = viele Mängel). Hierdurch wird bewirkt, dass die Feststellungen dem Auge (gegenüber einem Lesen von viel Prosa) in angenehmer Weise zugänglich gemacht und das Erkennen der Daten- und Informationsstruktur erleichtert wird.
Zur Überführung in ein metrisches System sind nunmehr „Ähnlichkeitsurteile" erforderlich. Ohne Verwendung eines Bezugsrahmens bleibt die weitere Bearbeitung zu subjektiv und verliert an Akzeptanz.
Die Subjektivität sinkt mit steigendem Einbezug einer Vielzahl von Personen und die Objektivität der Beurteilung steigt (et vice versa). In Schätzungsfällen bei einem Finanzgericht ist es daher regelmäßig angezeigt, dass bezüglich der Beurteilung der Beweiskraft der Buchführung die Sache möglichst nicht nur vor einem Einzelrichter, sondern vor den fünf Richtern eines Senats verhandelt, wobei es gerade hier auf die Beurteilung durch die ehrenamtlichen Richter ankommen könnte.
Das beschriebene Verfahren erscheint kompliziert; tatsächlich ist aber die Überführung des nicht-metrischen Systems in ein metrisches System bei einiger Übung und hoher Entscheidungsfreudigkeit in relativ kurzer Zeit möglich.37 Überträgt man die in Beispiel 1 aufgeführten Außenprüferfeststellungen in ein metrisches Tableau, könnte das Ergebnis etwa so wie in Beispiel 2 dargestellt aussehen.
Die Würdigung der in Abb. 2 skizzierten Mängel hätte möglicherweise zur Folge, [S. 121] dass die Beweiskraft der Buchführung (soeben) nicht mehr gegeben ist. Das Beurteilungstableau basiert auf subjektiven Beurteilungen. Es werden aber die dort enthaltenen Mängel und die Bereiche ohne Mängel sowie die Gesamtheit aller Segmente zur Beurteilung einem Adressaten auf einfache und übersichtliche Weise verdeutlicht. Ergänzend wurde eine zusätzliche Feststellung von „Umsätzen ohne Rechnung" als [8] in eckigen Klammern und Fettdruck eingestellt.
Bei den Ähnlichkeitsurteilen kann die mehrfach angesprochene Skalierung unter Berücksichtigung verstärkender oder dämpfender Faktoren erfolgen. Dies wird einsichtig, wenn man einmal die Art und Häufigkeit der Mängel nicht bei einem großen Restaurant, sondern bei einer nur am Wochenende geöffneten Dorfschänke mit einem Inhaber und keinen Mitarbeitern unterstellt. Diese Ähnlichkeitsurteile betreffen jeweils die einzelnen Mängel. In diesem Fall könnte das Tableau wie in Abb. 3 aussehen. Dies hätte möglicherweise hier, zur [S. 124] Folge, dass die Beweiskraft der Buchführung trotz gleicher Mängel (so gerade noch) gegeben ist. Mit der Vorbeurteilung auf skalierter Basis ist also zunächst nicht automatisch die Herbeiführung einer zutreffenden Gesamtbeurteilung verbunden. Positiv ist das Erkennen der Prüfungsfelder, in denen keine Mängel festgestellt wurden, weil es auf das sachliche Gewicht ankommt, welches aber nur bestimmt werden kann, wenn man die Gesamtheit kennt.38
35 Vgl. Barthel, Stbg 2016 S. 388.
36 Dieser Zwischenschritt kann bei einer überschaubaren Anzahl von Einzelfeststellungen entfallen. Das bringt aber den Nachteil mit sich, dass Vorbeurteilungen und Gesamtbeurteilung zusammenfallen, In der beruflichen Praxis beobachtet der Verfasser, dass einerseits die Komplexitätsreduktion in Bp-Berichten durch vollständiges Weglassen der besonderen Umstände des Einzelfalls und der Darstellungen der zutreffenden Bereiche der Buchführung - Letzteres ist wichtig zur Bestimmung der Gewichtung - bewirkt wird bzw. andererseits eine Komplexitätserhöhung durch eine Vielzahl der Verwendung von finanzamtsinternen Textbausteinen und der Zitierungen von Entscheidungen (die alle vom Steuerpflichtigen nicht beachtet worden seien) erreicht wird.
37 Ein Außenprüfer, der jährlich in 30 Fällen die Beweiskraft einer Buchführung zu beurteilen hat, realisiert mit jedem neuen Fall Lerneffekte und vermag die Ableitung eines metrischen Systems für Feststellungen von bislang nur beschriebenen Fehlern und Mängeln in wenigen Minuten zu realisieren, wobei die bisherigen Feststellungen in den anderen Fällen als Bezugspunkt dienen. Das Gleiche gilt für die Möglichkeit eines Steuerberaters, auf Grund seiner Erfahrungen in anderen Außenprüfungsfällen zügig zu einem metrisch ausgerichteten Tableau bezüglich Prüfungsfeststellungen zu gelangen. Durch den Vergleich von Prüfer-Tableau und Berater-Tableau ist relativ schnell und sicher auszumachen, wo die unterschiedlichen Auffassungen zwischen Prüfer und Berater groß bzw. weniger groß sind und wie die Feststellungen im gesamten Kontext zu sehen sind.
38 “Ob gegebenenfalls festgestellte Mängel der Buchführung zur formellen Ordnungswidrigkeit führen, ist in erster Liie eine Tatfrage und deshalb zunächst vom Finanzgericht zu entscheiden, zumal bei der Beurteilung eines Buchführungsfehlers nicht auf die formale Bedeutung des Buchführungsmangels, sondern auf dessen sachliches Gewicht abzustellen ist“, BFH vom 14.12.2011, XI R 5/10. HFR 2012 S. 1222.
Schließlich gehen die GAVP in § 6.6 auf Marktsituationen mit hoher Volatitlität ein: „The highest and best use of a property may be a holding for future use.“ Im Umkehrschluss ist zu folgern, dass bei Marktsituationen ohne hohe Volatilität dies anders zu sehen ist. In anderen Fällen, bei denen mehrere potentielle Arten des HABU identifizierbar sind, sollte der Bewerter diese alternativen Verwendungsmöglichkeiten im Gutachten erörtern und insbesondere das Level der künftigen Einnahmen- und Ausgaben bedenken.
§ 158 AO lässt im Ergebnis keine Abstufungen zu. Entweder ist eine Buchführung beweiskräftig oder sie es nicht.39s In gewisser Weise ist dies für den Steuerpflichtigen ein erheblicher Nachteil: „Im Zweifel" wird in der Praxis von einem Entscheidungsträger der Finanzbehörde die zu beurteilende Buchführung verworfen (damit macht man am wenigsten falsch), obgleich auch eine entgegengesetzte Interpretation möglich wäre, weil das Gesetz vom Grundsatz her von einer beweiskräftigen Buchführung ausgeht, und die sachliche Unrichtigkeit damit im Sinne einer Hürde bzw. gesetzlich gewollten Erschwernis erst festzustellen wäre (und eben nicht umgekehrt). Die sachliche Richtigkeit ist eben nicht zu beweisen, was bisweilen in der Praxis anders gesehen wird. Die Vielzahl von generierten Teilurteilen in den einzelnen Segmenten muss daher in eine Gesamtbeurteilung mit dem Ergebnis, dass die Buchführung beweiskräftig oder eben nicht beweiskräftig ist, einfließen.
Zur Gewinnung einer Gesamtbeurteilung mittels Multidimensionaler Skalierung40 sind verschiedene Verfahren möglich, z.B.
• „ die Rangreihenmethode, bei der mittels einer Befragung mehrerer Personen bezüglich ihrer (subjektiven) Beurteilung der verschiedenen Einzelfeststellungen eine Rangfolge durch paarweisen Vergleich hergestellt wird,
• die Ankerpunktmethode, bei der genau eine Feststellung (über die allseits Einigkeit besteht) als Vergleichsobjekt für alle anderen verbleibenden Feststellungen dient,
• das Ratingverfahren, bei dem die Ähnlichkeitseinschätzungen auf einer (häufig fünfstufigen) Ratingskala eingestellt werden (z.B. 1 = vollkommen ähnlich, 5 = vollkommen unähnlich).
Dazu sind zunächst einige theoretische Vorüberlegungen erforderlich. Danach wird die Vorgehensweise mittels der Ankerpunktmethode erläutert und schließlich werden mögliche Ergebnisse anhand von zwei Beispielen mit Anpassungsbedarf dargestellt.
39 Im Hinblick auf das Tatbestandsmerkmal „soweit“ § 158 AO ist genau genommen auf das einzelne Segment einer Buchführung abzustellen. Kann en Fehler punktuell behoben werden, liegt insoweit keine mangelhafte Buchführung mehr vor. Ordnungsgemäle Segmente einer Buchführung sind zu verwenden, was der Intention entgegenkommt, Vollschätzungen möglichst zu vermeiden. Leider vermeiden die Prüfer, ordnungsgemäße Segmente einer Buchführung zu benennen.
Diese Segmentierung findet sich auch in § 162 AO wieder; hier heißt sogar das erste Tatbestandsmerkmal „soweit". Ähnlich Grötsch, Stbg 2017 S. 500, 509. Nach dem Beschluss des BFH vom 13.7.2010, V B 121/09, BFH/NV 2010 S. 2015, bedarf es keiner Schätzung, wenn die nicht versteuerten Einnahmen sich (vollständig) aus im Rahmen einer Prüfung gefundenen handschriftlichen Aufzeichnungen ergeben.
40 Wie aus der Bezeichnung „Multidimensionale Skalierung“ hervorgeht, kann eine Vielzahl von beachtenswerten Skalierungsveranlassungen berücksichtigt werden. Bei einem dreidimensionalen Wahrnehmungsraum (z.B. zusätzliche Dimension: Fehlerhäufigkeit) wäre eine Visualisierung über eine Darstellung nach Art einer Bildpyramide möglich. Bei einem mehrskaiigen Darstellungserfordernis wäre auch eine zwei- oder dreitaflige Projektion möglich.
Da bei der Abgabe von Urteilen das subjektive Element dominiert, ist damit gleichzeitig die Gefahr der Willkür verbunden,41 insbesondere dann, wenn eine nachfol-gende Kontrollinstanz fehlt,42 wie es bei einer von einem [S. [S. 125]] Finanzgericht vorgenommenen Gesamtbewertung häufig der Fall ist.43 Willkür allein schon deshalb auszuschließen, weil ein Berichterstatter beim Finanzgericht über eine langjährige Erfahrung verfügt, wird dem Problem der Subjektivität von Entscheidungen nicht gerecht. Wer die Qualität einer Gesamtbeurteilung sichern oder verbessern will, darf sich nicht nur auf ein singuläres Qualitätskriterium wie „Erfahrung" verlassen. Wer Willkür und Subjektivität verringern will, muss den Beurteilungsprozess an mehreren Punkten auf mögliche Schwachstellen hin überprüfen. Die Gesamtbeurteilung wird beispielhaft zutreffender
• mit wachsender Anzahl der mitwirkenden Personen,44
• mit höherer Spezialisierung und größerer Erfahrung der mitwirkenden Personen,45
• mit der allgemeinen Anerkennung einer Endbeurteilung von Sachverhalten,46
• mit der Festlegung von Grenzen durch die Rechtsprechung,47
• mit der Festlegung eindeutiger Grenzen für die Beurteilung durch die Finanzbehörden,48
• mit Bezug auf einen früheren Sachverhalt im selben Betrieb,49
• mit Bezug auf einen möglichst ähnlich gelagerten bereits entschiedenen Fall,250
• mit Bezug auf punktuelle Übereinstimmungen von Verstößen bei Prüfer und Geprüftem,251
• mit der Verwendung besonders aussagekräftiger Methoden,52
• mit der Verbesserung der Effektivität von kontrollierenden Instanzen.53 Soll die Akzeptanz der Steuerpflichtigen bzw. der Finanzbehörden bezüglich der Entscheidungen über die Beweiskraft von Buchführungen erhöht bzw. die Masse der Schätzungsfälle verringert werden, sollte an die nachfolgenden Ansatzpunkte angeknüpft werden:
1. Mitwirkung der beurteilenden Personen
2. Auslegung der relevanten Vorschriften
3. Ähnlichkeit zu vergleichbaren Sachverhalten
4. Verwendung aussagekräftiger Methoden
5. Effektivität von kontrollierenden Instanzen
41 Vgl. Barthel, Die griffweise Schätzung, Stbg 2017 S. 315.
42 Im Bereich der Außenprüfung ist rechtlich durch die Finanzgerichtsbarkeit zwar eine Kontrollinstanz gegeben, faktisch ist diese aber nur eingeschränkt vorhanden,
- weil die Unternehmer das Kostenrisiko für Gericht und Berater scheuen,
- weil die Unternehmer mit belastenden Ungewissheiten nicht oder schlechter arbeiten können,
- weil die Unternehmen eine schnelle Entscheidung wegen möglicher Investitionen oder Desinvestitionen (Unternehmensverkauf) bevorzugen,
- weil der Druck von Familien- und Betriebsangehörigen übergroß wird.
43 Da de Kontrolle durch eine andere Instanz häufig nicht möglich ist, wäre es wünschenswert, bei den Finanzgerichten eigene Senate nur für Schätzungsfälle einzurichten, anstatt an erster Stelle auf die Steuerart und Zuständigkeit eines Finanzamts abzustellen.
44 Z.B. durch Entscheidung eines Richterkotlegiums anstelle eines Einzelrichters oder durch Einbeziehung von Sachverständigen, womit die Meinungsdominanz eines Einzelrichters zurückgedrängt wird.
45 Z.B. Prüfer, die etwa auf Ärzte, Apotheker oder Gastrobetriebe spezialisiert sind.
46 So werden z.B. bei der Ausschlussmethode Sachverhalte, die eindeutig sind, endbeurteilt, weil der Spielraum für unterschiedliche Urteilsfindungen gegen null tendiert.
47 Die Güte der Gesamtbeurteilung steigt, wenn eine feststehende Rechtsprechung Grenzen für das Verwerfen bzw. Nichtverwerfen einer Buchführung setzt (so z.B. im Fall des BFH vom 7.6.2000, lII R 82/97, BFH/NV 2000 S. 1462).
48 Die Güte der Gesamtbeurteilung steigt, wenn die Finanzbehörde selbst Klarheit schafft, in welchen Fällen die Gesamtbeurteilung bereits vorgegeben ist (Selbstbindungsverfahren). z.B. R 5 Abs. 2 EStR 2012 zu § 5 EStG; Abschn. 122 AEAO zu § 158.
49 Die Güte der Gesamtbeurteilung steigt, wenn es sich bei dem Bezugsobjekt bezüglich der Ähnlichkeit um denselben Steuerpflichtigen handelt, nur ist der Prüfungszeitraum ein anderer.
50 Allgemein zur Ähnlichkeitstheorie vgl. Barthel, Unternehmenswert: Expected Utility Theory versus Similarity Theory, DB 2007 S. 586.
51 Die Güte der Gesamtbeurteilung steigt, wenn ein Ähnlichkeitsbezug zwar zu weiter entfernt liegenden Sachverhalten, aber immer noch zu ähnlichen vergleichbaren Sachverhalten hergestellt werden kann.
52 Hierzu dient der vorliegende Beitrag mit dem Skalierten Prüfungsansatz und Verwendung der MDS.
53 Die Güte der Gesamtbeurteilung steigt, wenn eine Kontrollinstanz effektiv wirkt, und zwar entweder im Vorfeld präventiv sowie im Nachhinein durch Befassung mit einem konkreten Fall.
Ankerpunkt für die Messung der Ähnlichkeiten/Unähnlichkeiten bei den nachfolgend beschriebenen Sachverhalten AP1 bis AP8 soll der bereits erwähnte Grenzfall des BFH-Urteils vom 26.4.198354 sein: Der Unternehmer betrieb im Entscheidungsfall einen Kiosk mit Tabakwaren, Zeitschriften, Süßwaren, Getränken in Flaschen sowie Kaffee und erzielte im Prüfungszeitraum 1973 bis 1975 im Durchschnitt einen Umsatz von rund 700.000 DM und einen Gewinn von rund 40.000 DM. Es fehlten Wareninventuren, der Eigenverbrauch war nicht aufgezeichnet und überdies zu gering angesetzt worden. Bei einer ordnungsgemäß durchgeführten Nachkalkulation ergaben sich Fehlbeträge mit jeweils Auswirkungen auf das sachliche Ergebnis. Der BFH hatte hingegen auf die Prüfung der Gewichtigkeit der fehlenden Wareninventuren und auf das Erfordernis einer Mindestabweichung von 10 % bei der Nachkalkulation hingewiesen, die im Entscheidungsfall nicht vorlag, und den Fall zurückverwiesen.
Hiernach würde sich ein zweidimensionaler Wahrnehmungsraum - durch subjekti-ves Einzelurteil oder besser durch Befragung sachverständiger Personen - mit den Dimensionen „Art der Mängel" sowie „Unternehmensgröße" für die Beurteilung der Beweiskraft der Buchführung etwa wie in Abb. 4 ergeben, wobei auf der x-Achse die Art bzw. die Schwere der Mängel und auf der y-Achse die Unter-nehmensgröße55 abgebildet sind. Zur Verdeutlichung sollen ferner einige Beispiele für Außenprüfungen (AP) angeführt werden, in denen die Auffassung des Verfassers niedergelegt ist und, soweit nicht anders angegeben, nur die jeweils aufgeführten Mängel aufgedeckt und bei durchgeführten [S. 126] Geldverkehrsrechnungen keine Auffälligkeiten aufgedeckt wurden (0 = Minimum, 1 = Maximum):
• AP1 (Außenprüfung, Fall 1): Es wurde bei einem Großbetrieb die Garantierückstellung falsch berechnet, was zu Mehrgewinnen pro Jahr von ca. 1 Mio. € führte Beweiskraft gegeben.
• AP2: Bei einem Großbetrieb fehlen die jährlichen Inventuren; die Warenbestände wurden geschätzt. Die selbst programmierte Kassensoftware nebst Änderungen wurde nicht gespeichert. Stornierungen wurden nicht dokumentiert Beweiskraft nicht gegeben.
• AP3: Der Eisdielenbesitzer ist bereits einschlägig wegen Steuerhinterziehung vorbestraft. Die Lohnzahlungen für einen Mitarbeiter wurden nicht verbucht. Es liegt im Übrigen eine perfekte Buchführung vor Beweiskraft nicht gegeben.
• AP4: Die Einnahmen aus einem im Kundeneingang aufgestellten Kaffeeautomaten wurden nicht täglich, sondern nur einmal monatlich aufgezeichnet Beweiskraft gegeben.
• AP5: Der eingangs erwähnte Eisverkäufer im Stadion führt keine Registrierkasse und kein Kassenbuch für die relativ geringen Einnahmen und Ausgaben, weil diese lediglich durch Vergleich von Geldbeständen auf losen Zetteln notiert wurden Beweiskraft gegeben.
• AP6: Einem größeren Handy-Händler wurden mehrere Karussellgeschäfte nachgewiesen Beweiskraft nicht gegeben.
• AP7: Bei einem mittelgroßen Betrieb wurden durch Brandeinwirkung das gesamte Belegwesen und die Buchführung sowie der PC mit den gespeicherten Fibu-Daten inklusive Sicherungskopien vernichtet Beweiskraft nicht gegeben.
• AP8: Bei einem größeren Filialunternehmen lagen zeitweise bei einzelnen Filialen ein nicht chronologisch geführtes Kassenbuch und nur unvollständige Inventurunterlagen vor Beweiskraft gegeben. Variante UoR: Zusätzlich wurden Umsätze ohne Rechnung in erheblicher Höhe festgestellt Beweiskraft nicht gegeben.
Hiernach wäre infolge von Anpassungen die Beweiskraft der Buchführung im Fall des Sachverhalts laut Abb. 3 (“SV3") gegeben, nicht aber bei AP8, wenn zusätzlich “Umsätze ohne Rechnungen" in nicht belangloser Höhe (“UoR") festgestellt wurden. Je weiter die Distanzpunkte vom Ankerpunkt ( -Bild- ) entfernt liegen, umso mehr liegt Unähnlichkeit zum Ankerpunkt vor. Dies wird durch die zu Grunde liegende Metrik visualisiert.56 Innerhalb des Wahrnehmungsraums werden die Bareiche, bei denen die Beweiskraft gegeben bzw. nicht gegeben ist, unterschiedlich farblich gekennzeichnet (grün/rot). In Anlehnung an Guttrnann57 wird vorliegend ein „Treppen -Muster” verwendet (scala = Treppe). Diese treppenförmige Trennlinie durch die Matrix erleichtert die Gewinnung eines Gesamturteils. Es muss bei einer Visualisierung deutlich werden können, wenn bei einer Beurteilung die Beweiskraft einer Buchführung “so gerade noch eben" gegeben bzw. „so eben nicht mehr" gegeben ist. Dies zu visualisieren wird durch die Multidimensionale Skalierung wegen der zu Grunde liegenden Metrik ermöglicht. Ein anderes Verfahren ist derzeit nicht bekannt.
MATRIX
Abb. 4: Zweidimensionaler metrischer Wahrnehmungsraum
SV2 = Sachverhalt wie bei Abb. 2
SV3 = Sachverhalt wie bei Abb. 3
UoR = AP2 sowie zusätzliche „Umsätze ohne Rechnung”
Grüne Fläche: Buchführung ist beweiskräftig; rote Fläche: Buchführung ist zu beanstanden. Je weiter ein Punkt vom Ankerpunkt entfernt liegt, umso weniger gleicht er dem als Vergleichsrnaßstab herangezogenen Ankerfall. [] = Ankerpunkt (Sachverhalt lt. BFH-Urteil vom 26.4.1983).
54 BFH vom 26.4.1983, VIII R 38/82, BStBl II 1983 S. 618.
55 Die Unternehmensgröße ist branchenindividuell mit möglichst hohem Detaillierungsgrad zu bestimmen. Bei Lebensmittelfilialunternehmen ist ein Unternehmen mit zehn Filialen als klein" und ein Unternehmen ab 1 000 Filialen als groß einzuordnen, bzw. ein Lebensmittelgeschäft mit ca. 100 qm Fläche (Tante-Emma-Laden) als „klein“ und eines mit ca. 1 000 qm Fläche eher als „groß“ einzuordnen, obgleich diese Unternehmen alle dem Lebensmitteleinzelhandel zuzuordnen sind.
56 Im Fokus der Betrachtung stehen auf dieser Beurteilungsebene nicht die einzelnen Fehler, Mängel und Beanstandungen, sondern - auf einer bereits hochaggregierten Gesamtbetrachtung - die Einstufung in eine Matrix, die einen summarischen Ähnlichkeitsvergeich mit anderen, ähnlichen Sachverhalten zulässt.
57 Vgl. Guttmann, A basis for scaling qualitative data, American Sociological Review 1944 S. 139.
Bezüglich der Beurteilung der Beweiskraft der Buchführung verweist § 158 AO auf einzuhaltende Einzelvorschriften (§§ 140 bis 148 AO), die zum Teil formelle wie auch materielle Anforderungen normieren, insbesondere nach § 146 Abs. 1 AO die Pflicht zu vollständigen und richtigen Aufzeichnungen, sowie auf das Erfordernis einer Einzelfallbetrachtung. Aus dem Wortlaut des § 158 AO (“entsprechen") sowie dem Sinn und Zweck der Regelung zur Beweiskraftverrnutung ergibt sich, dass nicht jeder Mangel zu einer nicht mehr ordnungsgemäßen Buchführung führt mit der Folge, dass die sich aus § 158 AO ergebende Vermutung der Beweiskraft „erschüttert“ ist. Entscheidend ist vielmehr, welches „sachliche Gewicht” die Gesamtheit der nachgewiesenen Mängel hat.
Abb. 4: Zweidimensional metrischer Wahrnehmungsraum
SV2 = Sachverhalt wie bei Abb.2
SV3 = Sachverhalt wie bei Abb.3
UoR = AP2 sowie zusätzliche "Umsätze ohne Rechnung"
Grüne Fläshe: Buchführung ist beweiskräftig; rote Fläche: Buchführung ist zu beanstanden. Je weiter ein Punkt von Ankerpunkt entfernt liegt, umso weniger gleicht er dem als Vergleichmaßstab herangezogenen Ankerfall
= Ankerpunkt (Sachverhalt lt. BFH-Urteil vom 26.4.1983)
Für die Gewichtung ist eine Gesamtbetrachtung unter Berücksichtigung „aller" Umstände des Einzelfalls und damit ein nachvollziehbarer Abwägungsprozess erforderlich. Für diese Gesamtbewertung ist in Praxis, Literatur und Rechtsprechung bisher keine überzeugende und transparente Methodik gefunden worden. Um diese Lücke auszufüllen, bietet sich die Skalierte Außenprüfung mit einer „an die Begleitumstände angepassten Gesamtbewertung“ einer Buchführung nebst entsprechend angepasster Prüfungsdurchführung an. Knüpft das Finanzamt im Rahmen der Gesamtwürdigung nur an Einzelvorschriften, aber an keinen einzigen Begleitumstand an, ist dies ein Indiz für eine einseitige und damit fehlerbehaftete Gesamtwürdigung. Damit ist die in § 158 AO vom Gesetzgeber normierte Beweiskraftvermutung nicht erschüttert.[S. 127]
Die in § 158 AO genannten Einzevorschriften der §§ 140 bis 148 AO stellen ein Leitbild für die Beweiskraft einer ordnungsgemäßen Buchführung dar; sie können nicht universell, ohne Wenn und Aber angewendet, sondern müssen unternehmensspezifisch angepasst werden. Die Rechtsgrundlage hierfür eröffnet die Verwendung der Tatbestandsmerkmale „nach den Umständen des Einzelfalls", „alle" und „entsprechen" in §§ 158, 88 AO. Eine Möglichkeit zur Operationatisierung des unbestimmten Rechtsbegriffs der „Umstände des Einzelfalls" bietet der Ansatz der Skalierten Außenprüfung. Hierbei werden die angeführten Einzelvorschriften der §§ 140 bis 148 AO an die angeführten Umstände zur Erlangung der gesetzlich normierten Einzelfallgerechtigkeit und intendierten Rechtsfolge angepasst. Diese Anpassung wirkt wie eine Klammer vor jeder einzelnen zu beachtenden, in § 158 AO genannten Einzelvorschrifft.
Zur Uberführung qualitativer, nicht-metrischer Daten zur Beweiskraft der Buchführung in einem Beispielsfall wurde vorliegend als Zwischenschritt zur Reduzierung der Datenmenge zunächst eine zweidimensionale Matrix verwendet und anschließend auf dieser Basis die Gesamtbeurteilung in einem ebenfalls zweidimensionalen Wahrnehmungsraum mit den Dimensionen Art / Schwere der Mängel und Unternehmensgröße nebst Sachverhalten in ähnlichen Fällen eingestellt. Die räumliche Distanz in diesem Tableau gibt den Grad der Ähnlichkeit bzw. Unähnlichkeit zu einem Ankerpunkt, der wieder als Vergleichsmaßstab dient, über den weitere, gefestigte Erfahrungen zur Beurteilung der Beweiskraft der Buchführung vorliegen (Ankerpunktmethode). Der relevante Sachverhalt als Ankerpunkt dient als tertium comparationis, wenn er mindestens eine charakteristische und bedeutsame Eigenschaft mit dem zu beurteilenden Sachverhalt gemeinsam hat. Somit stellt die Verwendung der Multidimensionalen Skalierung im Ergebnis eine geeignete Handlungsalternative zur Verbesserung der Güte von Gesamtbeurteilungen in Bezug auf die Beweiskraft einer Buchführung dar.
Die Massierung der Schätzungsfälle auch bei den Finanzgerichten stellt die künftige Relevanz des Ansatzes der Skalierten Außenprüfung heraus. Die Verwendung dieses Konzepts könnte dazu beitragen, dass insbesondere bei kleineren und mittleren Unternehmen, bei denen es im Gegensatz zu Großbetrieben in nicht akzeptabler Häufigkeit zu Verwerfungen der Buchführung kommt, künftig die Zahl der Schätzungsfälle und damit der fiskalisch induzierten Vollstreckungshandlungen und Insolvenzen abnimmt. Ziel ist, dass sich mehr Qualität und Flexibilität bei der Beurteilung der Beweiskraft der Buchführung einstellen und die Schätzungsfälle bei inhabergeführten bargeldintensiven Betrieben von bislang über 90 % auf weniger als die Hälfte der Fälle reduziert werden.
Bei Außenprüfungen von inhabergeführten bargeldintensiven Betrieben finden die Prüfer oft Mängel in der Kassenführung, was regelmäßig zu Diskussionen über die Bemessung der Höhe eines Sicherheitszuschlags im Rahmen einer griffweisen Schätzung führt. Der folgende Beitrag behandelt Anknüpfungspunkte für eine Gegenwehr.
Unter „Schätzung" wird im Folgenden die methodisch fundierte näherungsweise Bestimmung einer unbekannten Zielgröße verstanden. Zielgröße ist dabei, bezogen auf das Steuerrecht, die „nicht ermittelbare Besteuerungsgrundlage" gem. § 162 Abs. 1 AO. Ist die Zielgröße genau bestimmbar, sollte der Begriff „Wertermittlung" Verwendung finden, bzw. für spezielle Bereiche die Begriffe „Gewinnermittlung", „Vorsteuerermittlung" usw. Eine Schätzung ist auch bei genau bestimmbaren Zielgrößen möglich, wenn andere Ziele wie Zeit- und/ oder Kostenersparnis vorrangig sind. Da bei einer Schätzung eine nur „näherungsweise" Bestimmung der unbekannten Zielgröße hingenommen wird, richtet sich, wenn andere Ziele keine Rolle spielen, der Fokus darauf, diese Bestimmung mit einem möglichst hohen Genauigkeitsgrad vorzunehmen. Der BFH postuliert in seinem Zeitreihenurteil2 insoweit folgerichtig für den Bereich der Schätzung anlässlich einer Betriebsprüfung das Ziel der Bestimmung eines „realitätsgerechten" Ergebnisses3 bzw. der Bestimmung von Besteuerungsgrundlagen, die der Wirklichkeit „möglichst nahe" kommen.4 Erfolgt die Bestimmung der unbekannten Zielgröße nach einem anerkannten Prinzip, welches ein systematisiertes Verfahren auf der Basis von Wahrscheinlichkeitsüberlegungen5 zur Gewinnung von Erkenntnissen ermöglicht, ist die näherungsweise Bestimmung „methodisch fundiert". Ist die Schätzung nicht methodisch fundiert, sondern basiert auf anderen Kriterien wie „Erfahrung", „Belieben", „freies Ermessen" o.Ä., ist die Nachvollziehbarkeit der Schätzung nicht gegeben und man sollte hierfür statt „Schätzung" den Begriff „überschlägige Einschätzung" verwenden; mangels einer Rechtsgrundlage ist diese rechtswidrig.
1 Dr. Carl W. Barthel ist als Steuerberater, vereidigter Buchprüfer und Rechtsbeistand in eigener Kanzlei in Köln tätig.
2 BFH vom 25.3.2015, X R 20/13, BStBI II 2015 S. 743 (Zeitreihenurteil); vgl. hierzu auch bereits Wolenski, Stbg 2016 S. 268, sowie hierzu Kulosa, Stbg 2016 S. 271 und dazu Wolenski, Stbg 2016 S. 272.
3 3 BFH vom 25.3.2015, X R 20/13, BStBI II 2015 S. 743 Rz. 74 (dort unter bb) und Rz. 75 (dort unter cc).
4 BFH vom 25.3.2015, X R 20/13, BStBI II 2015 S. 743 Rz. 60.
5 Jede Schätzung hat nach BFH vom 25.3.20 15, X R 20/13, BStBI II 2015 S. 753 Rz. 60, zum Ziel, Besteuerungs-grundlagen mit Hilfe von Wahrscheinlichkeitsüberlegungen zu ermitteln.
Gibt es mehrere Schätzungsmethoden, wird das angestrebte Ergebnis umso ge-nauer, als die Ergebnisse mehrerer Schätzungsmethoden in gewichteter Weise verwendet werden oder, wenn nur eine Schätzungsmethode verwendet werden soll, die „geeignetste" Schätzungsmethode angewandt wird. Für den Fall einer Schätzung bei Betriebsprüfungen hat der BFH im Zeitreihenurteil die Vorrangigkeit bzw. die bessere Geeignetheit bestimmter Schätzungsmethoden explizit angesprochen und die „Geeignetheit" einer Schätzungsmethode nach den Kriterien der Betriebsbezogenheit bzw. der Berücksichtigung individueller Verhält-nisse der verwendeten Datenbasis beurteilt.6
6 BFH vom 25.3.2015, X R 20/13, BStBl II 2015 S. 743 Rz. 61, 64. Ausführlich zum Streit um Schätzung, Verprobung und Kassenbuchführung vgl. Kamps, Stbg 2017 S. 201, allgemein zur Schätzung auf Grund von Kassenmängeln vgl. Barthel, StBp 2016 S. 80; zu den Maßstäben zur Überprüfung von Schätzungen Barthel, Stbg 2016 S. 388.
Ist bei einer Schätzung eine Datenbasis nicht vorhanden (z.B. „Zuschätzung pro Jahr 6.000 €") oder weist die verwendete Datenbasis keine oder insgesamt nur eine geringe Korrelation (d.h. Wechselwirkung) zur Zielgröße aus (z.B. „Zuschätzung zum Umsatz und Gewinn von 7 % vom Umsatz"), wird im Folgenden von einer „griffweisen Schätzung" gesprochen.7 Dieser Spezialfall ist in der AO nicht [S. 316] geregelt. Im Gegensatz zur überschlägigen Einschätzung ist bei der griffweisen Schätzung - mag diese auch noch so grob sein - eine Nachvollziehbarkeit gege-ben.8 Die Eigenschaft einer „Nachvollziehbarkeit" darf nicht mit den Eigenschaften „Richtigkeit“ oder „Treffsicherheit" gleichgesetzt werden.9 Obgleich viele Facetten einer griffweisen Schätzung von der Rechtsprechung bzw. in der Literatur aner-kannt sind, stellt sich bei einer griffweisen Schätzung immer die Frage, ob die Ver-wendung verhältnismäßig ist, insbesondere wenn andere Schätzungsmethoden bestehen, die eine Datenbasis verwenden, die eine höhere Betriebsbezogenheit aufweisen bzw. in höherem Maße die individuellen Verhältnisse des Steuerpflichti-gen berücksichtigen und somit geeigneter10 sind.
Griffweise Schätzungen können offen dargelegt, aber auch versteckt innerhalb anderer Schätzungsmethoden verwendet werden. Letzteres ist der Fall, wenn in-nerhalb eines komplexen Schätzungsalgorithmus durch die Verwendung mindes-tens einer Teilschätzungsgröße die anderen Parameter dominiert werden und eine Sensitivitätsanalyse zeigt, dass bereits kleinere Änderungen der Ausgangsparame-ter große Auswirkungen haben.
Werden im Rahmen der derzeit bei Prüfern populären 30/70-Methode (d.h. Geträn-keanteil = 30 %; Speiseanteil = 70 %) die Getränke eines Restaurants für ein Jahr nachkalkuliert und führt diese Nachkalkulation zu einem Getränkeumsatz von 100.000 €‚ so ergibt sich bei Anwendung der 30/70-Methode ein Gesamtumsatz von 333.333 €, hingegen bei Schätzung der jeweiligen Umsatzanteile von 20 : 80 ein Gesamtumsatz von 500.000 € und bei Schätzung der jeweiligen Umsatzanteile von 40 : 60 ein Gesamtumsatz von 250.000 € bzw. bei 50 : 50 ein Gesamtumsatz von 200.000 € usw. Wurden bislang nur 200.000 € deklariert, ergeben sich Mehrumsätze bzw. Mehrgewinne von 0 €‚ 50.000 €‚ 133.333 € bzw. 300.000 €‚ was bei angeblich unzutreffenden Umsatzgrundlagen an Beliebigkeit denken lässt
Dieses Beispiel zeigt, dass die durchgeführte „Nachkalkulation durch die griffweise abgeleitete Schätzungsgröße „Umsatzanteile" überlagert wurde und insgesamt nicht mehr von einer „Nachkalkulation" gesprochen werden sollte. Würde man im Rahmen der Erörterung der „Nachkalkulation" darlegen, dass zusätzlich Mineral-wasser für 1.000 € p.a. nicht in den Verkauf gelangte, so würde bei einem Rohge-winnaufschlag laut Nachkalkulation für Mineralwasser von 800 % (d.h. Wenigerum-satz von 9.000 € p.a.) und bei griffweise geschätzten Umsatzanteilen von 20 : 80 bei einem fünfjährigen Prüfungszeitraum von einem Wenigerumsatz und - gewinn von insgesamt 225.000 € (5 x 45.000 €) zzgl. 19 % USt und somit von einer Hebel-wirkung von 1 zu 225 auszugehen sein (das Beispiel betrifft den konkreten Steuer-fall eines Kölner Finanzamts).
Es ist daher nicht verwunderlich, dass bei der 30/70-Methode die Validierung (also der empirische Nachweis) in der Praxis - wie im Zeitreihenurteil gefordert wurde11 - fehlt. Im Folgenden werden griffweise Schätzungen nur thematisiert, wenn sie offen dargelegt sind, sonst würde die Erörterung aller Facetten von griffweisen Schät-zungen den Rahmen dieses Beitrags sprengen.
7 Der BFH charakterisiert die „griffweise Schätzung" im Spektrum der verschiedenen denkbaren Schätzungsmetho-den als diejenige, die mit den größten Unsicherheiten behaftet ist und konkreten Tatsachengrundlagen vollständig oder nahezu vollständig entbehrt, BFH vom 28.9.2011, X B 35/11, BFH/NV 2012 S. 177.
8 Bei einer griffweisen Schätzung ergibt sich die Nachvollziehbarkeit z.B. durch die multiplikative Verknüpfung eines Festbetrags x Anzahl der Jahre oder fester Prozentsatz x Umsatz. Je gröber die Schätzungsmethode ist, umso leich-ter ist die Nachvollziehbarkeit und umso schlechter ist die Treffsicherheit.
9 Bei der Verwendung von Zeitreihen bei Schätzungen handelt es sich eine nachvollziehbare Methode, die aber - wie der BFH im Zeitreihenurteil vom 25.3.2015, X R 20/13, BStBI II 2015 S. 743 ff., überzeugend nachweist - fehlerbehaf-tet ist (Vorliegen methodenbedingter Unsicherheiten, Rz. 63; ständige Erzielung von Mehrergebnissen, Rz. 62 [dort unter aa], Erfordernis einer Sensitivitätsanalyse wegen der Hebelwirkung, Rz. 69).
10 BFH vom 25.3.2015, X R 20/13, BStBI II 2015 S. 743 ff. Das Erfordernis der Eignung einer Schätzungsmethode findet sich dort in den Rz. 43, 44, 55, 56, 59, 61, 72. 94, 96.
11 BFH vom 25.3.2015, X R 20/13, BStBI II 2015 S. 743 Rz.43.
Neben der in § 162 AO geregelten Voraussetzung, dass die Finanzbehörde die „Besteuerungsgrundlage nicht ermitteln kann", werden aus der in § 162 Abs. 1 Satz 2 AO normierten Verpflichtung, „alle Umstände" 12 zu berücksichtigen, sechs Be-dingungen abgeleitet, die erfüllt sein müssen, ehe die Schätzung durchgeführt wer-den darf.
Übersicht 1: Hürden für die Anwendung der griffweisen Schätzung
12 Gerade durch die Begleitumstände eines Sachverhalts vermag dieser oft erst zutreffend beurteilt werden. Dies be-zieht sich insbesondere auf Fälle, bei denen die Sachverhalte in einem Bp-Bericht einseitig (z.B. lediglich durch Auf-listung der Mängel der Kassenführung) dargestellt werden und damit zu einem Zerrbild führen. Statt Verfremdung ei-nes Sachverhalts durch Weglassen bedeutsamer Umstände in einem Bp-Bericht (ähnlich der Vorgehensweise von Bismarck in der „Emser Depesche“) sollte eine faire, umfängliche Darstellung angestrebt werden mit dem Ziel der Ermöglichung einer bewussteren Wahrnehmung und Beurteilung des Sachverhalts.
Diese erste Hürde lässt sich unmittelbar dem Gesetzeswortlaut in § 162 Abs. 1 Satz 2 AO („nicht ermitteln kann") entnehmen. Ein „Drauflosschätzen" (Herleitung der Schätzungsbefugnis durch Anführung eines gewichtigen Kassenmangels oder die vorschnelle Behauptung einer mangelnden Mitwirkung nebst Bezugnahme auf mehrere FG-Entscheidungen bezüglich prozentualer Sicherheitszuschläge) [S. 317] ist ebenso gesetzwidrig wie die Durchführung von Ermittlungen, die nur zum Schein, also nicht ernsthaft erfolgen.
Der Amtsermittlungsgrundsatz, wonach der Sachverhalt zu Gunsten wie zu Ungunsten des Steuerpflichtigen zu erforschen ist, gilt sowohl für die Finanzbehörde wie für das FG, § 88 AO, § 76 FGO. In seinem Beschluss vom 28.9.201113 bezeichnet der BFH die „griffweise Schätzung" ohne vorherige Ermittlungsversuche (Plural!) als Verfahrensmangel, was zur Zurückverweisung führte: Dabei betonte der BFH, dass das FG die sich im Einzelfall aufdrängenden Überlegungen auch ohne entsprechenden Hinweis der Beteiligten anstellen muss. Bezüglich des Begriffs „Tatsachengrundlagen" bezieht sich der BFH auf das Tatbestandsmerkmal „Besteuerungsgrundlagen" in § 162 AO i.V.m. der Legaldefinition in § 199 Abs. 1 AO „tatsächliche und rechtliche Verhältnisse".
An die Unmöglichkeit einer vorherigen Ermittlung sind hohe Anforderungen zu stel-len, da die Schätzung, insbesondere die Vollschätzung, auf Grund der Gesetzesintention die Ausnahme darstellt. Insoweit stellt der AEAO zu § 158 klar, dass eine Vollschätzung an Stelle einer Zuschätzung nur dann in Betracht kommt, wenn sich die Buchführung in wesentlichen Teilen als unbrauchbar erweist. Betragen die erklärten Umsätze 500.000 €, 600.000 € und 700.000 € und ergeben sich nach griffweiser Schätzung Umsätze von 550.000 €, 660.000 € und 770.000 €, handelt es sich um Vollschätzungen. Im direkten Gegensatz hierzu ergeben sich bei unwesentlichen Mängeln nach R 5 Abs. 2 EStR 2012 zu § 5 EStG keine negativen Konsequenzen: „Enthält die Buchführung formelle Mängel, ist ihre Ordnungsmäßigkeit [regelmäßig] nicht zu beanstanden, wenn das sachliche Ergebnis der Buchführung dadurch nicht beeinflusst wird. Enthält die Buchführung materielle Mängel [ ... ], wird ihre Ordnungsmäßigkeit dadurch nicht berührt, wenn es sich dabei um unwesentliche Mängel handelt.“ Das „sachliche Ergebnis" einer Buchführung bezieht sich im Wesentlichen auf die Steuerbemessungsgrundlagen „Gewinn" bzw. „Umsatz". Zwischen dem Vorliegen nur unwesentlicher Mängel auf der einen Seite (dies bedeutet: keine Schätzungsbefugnis) und der Unbrauchbarkeit von wesentlichen Teilen der Buchführung (dies bedeutet: Vollschätzungsbefugnis) auf der anderen Seite liegt der Anwendungsbereich von Teilschätzungen, so dass die Anwendbar-keit von Sicherheitszuschlägen als die wichtigste Variante von griffweisen Schätzungen bereits von daher eingegrenzt ist und genaue, dokumentierte und nachvollziehbare Ermittlungen der Finanzbehörde bzw. des FG erfordert.14
Die „vorherige" Ermittlungspflicht der Finanzbehörde bezieht sich nicht nur auf die fehlenden Tatsachen bzw. auf einen falschen Tatsachenvortrag des Steuerpflichtigen, sondern auch auf die vorhandenen, aber nicht verwendungsfähigen Teile der Aufzeichnungen bzw. der Buchführung. Bestehen die zu behebenden Unsicherhei-ten aus einer Vielzahl von Tatsachen i.S.v. § 162 AO, hat die Finanzbehörde (res-pektive das FG) zu benennen, welche Tatsachen verwendungsfähig sind und welche nicht und ob Letztere ohne griffweise Schätzung durch eine methodisch fundierte Teilschätzung behebbar sind.
13 BFH vom 28.9.2011, X B 35/11, BFH/NV 2012 S. 177.
14 BFH vom 28.9.2011, X B 35/11, BFH/NV 2012 S. 177.
Diese Hürde lässt sich unmittelbar dem Gesetzeswortlaut in § 162 Abs. 1 Satz 1 AO entnehmen (Tatbestandsmerkmal „soweit"). Durch die Bezugnahme des griffweise gewählten Sicherheitszuschlags auf eine nicht eingegrenzte (und zudem noch als falsch erkannte) Bezugsgröße wie „Jahresumsatz" erfolgt faktisch eine Totalschät-zung (z. B. 110 % des Umsatzes), die dem Gesetzeswortlaut („soweit") nicht zu ent-nehmen ist. Bei einer „griffweisen" Schätzung ist evident, dass deren Anwender und deren Adressat unterschiedliche Vorstellungen darüber entwickeln werden, was mit der Schätzung erfasst ist, sowie welche Teile der Buchführung und der Kasse ordnungsgemäß sind.
Offen bleibt bei der Wahl der Bezugsgröße (meist Umsatz, aber auch andere Krite-rien wie Anzahl der Kunden), welche Alternativen bestanden und welche Abwä-gungsüberlegungen (§ 5 AO) vorgenommen wurden.
Der Schätzungsbereich bezieht sich, da Vollschätzungen die Ausnahme darstellen sollen, stets auf die Teilmenge der betriebsinternen Daten, die nicht verwendungs-fähig sind. Diese Erkenntnis gilt gleichermaßen wegen des Tatbestandsmerkmals „soweit" in § 158 AO bezüglich der Teile einer Buchführung, die sachlich richtig bzw. sachlich unrichtig sind.
Hinweis:
Es sollte nicht hingenommen werden, wenn der Prüfer behauptet, der vorgefunde-ne Mangel (z. B. fehlende Organisationsunterlagen) „ergreife" die gesamte Buch-führung und damit sei letztlich eine Vollschätzung erforderlich.
Bei der griffweisen Schätzung fehlt es im Falle einer multiplikativen Verknüpfung einer unsicheren Größe (z.B. Prozentsatz x) mit einer ebenfalls unsicheren, aber bekannten Größe (z.B. falsch erklärter Umsatz i.H.v.y) an der inneren Verbindung (Konnexität) zwischen den Faktoren x, y und den zu schätzenden Tatsachengrund-lagen. Besonders deutlich wird dies, wenn der Gewinn (= Bemessungsgrundlage) durch Bestandsvergleich unter Berücksichtigung von Veränderungen des Betriebs-vermögens, der Entnahmen und Einlagen nach § 4 Abs. 1 EStG zu ermitteln ist, diese Teilbemessungsgrundlagen aber jeweils contra legem als Besteuerungs-grundlage i.S.v. § 199 Abs. 1 AO umgedeutet und auf Grund einer Schätzung nach Maßgabe von Umsätzen erhöht werden. Es ist unzulässig, die Steuer unmittelbar selbst oder eine [S. 318] Größe zu schätzen, die nicht Gegenstand der Besteue-rungsgrundlage ist.
Die Reduktion auf zwei Faktoren (Prozentsatz sowie Umsatz) ist grob. Das Gesetz verlangt in § 162 Abs. 1 Satz 2 AO die Berücksichtigung „aller" relevanten (Begleit-)Umstände, was deren vorherige Identifikation voraussetzt. Gesetzgeberisches Ziel ist somit die Erlangung eines möglichst zutreffenden Ergebnisses und damit die Vermeidung einer Fehlschätzung. Als Begleitumstände sind regelmäßig u.a. von Bedeutung:
• Höhe der Rohgewinnaufschlagssätze,
• Erbringung operativer Leistungen des Inhabers, unmittelbarer Kassenzugang des Inhabers,
• Fokus des unternehmerischen Konzepts auf Qualität oder auf Quantität,
• Wettbewerbssituation usw.
Wenn z.B. der Rohgewinnaufschlagssatz bei einer Tabakwarengroßhandlung (oh-ne Automatenumsatz) ca. 2 %‚ bei einem Kiosk ca. 20 %, bei einer Gaststätte ca. 200 % und bei einem Kaffeestand auf einer Messe ca. 2000 % beträgt, wirkt sich im ersten Fall bei sonst gleichem Umsatz ein Sicherheitszuschlag von z.B. 10 % offen-sichtlich strangulierend aus, weil der Rohgewinnaufschlagssatz in einer Weise er-höht wird, die abwegig erscheint. Dieses Beispiel zeigt, dass die Verwendung von Sicherheitszuschlägen in Form von Prozentsätzen vom Umsatz nicht „alle Umstän-de" berücksichtigt. Da bei dieser „Methode" der eine Faktor unsicher, aber bekannt und nicht änderbar ist (Umsatz), müssten bei einer Berücksichtigung „aller" Um-stände gem. § 162 Abs. 1 Satz 2 AO diese im zweiten Faktor, dem (griffweise ge-schätzten) Prozentsatz, in differenzierter und nachvollziehbarer Weise ihren Nieder-schlag finden, was bislang noch keinem FG in befriedigender Weise gelungen ist (s. IV.). Hieraus ist abzuleiten, dass der Sicherheitszuschlag in Form von Prozents-ätzen des Umsatzes eine Möglichkeit bietet, einvernehmlich einen Steuerfall abzu-schließen, aber nicht eine „geeignete" Schätzungsmethode im Sinne der neueren Rechtsprechung des BFH15 darstellt.
Die einzelnen Umstände sollten, damit Nachvollziehbarkeit erlangt wird, in ihrer Be-deutung (niedrig - mittel - hoch) abgestuft werden. Auch bei einer niedrigen Bedeut-samkeit ist ein Umstand zwingend zu berücksichtigen. Nicht bedeutsame Umstände sind der Grad der Fahrlässigkeit/des Vorsatzes (die Schätzung der Ermittlung zu-treffender Besteuerungsgrundlagen dient nicht der Abschreckung und auch nicht der Bestrafung) oder die Vielzahl oder Schwere der Mängel. Die einzelnen bedeut-samen Umstände sind zu operationalisieren sowie quantifiziert und gewichtet in die Schätzung einzubeziehen.
15 BFH vom 25.3.2015 X R 20/13, BStBI 2015 S. 743.
Bezüglich der Forderung nach der „Geeignetheit" einer Schätzungsmethode hat sich die in vielen FG-Entscheidungen geäußerte Rechtsauffassung durch das Zeit-reihenurteil des BFH vom 25.3.2015 geändert. Die Analyse der vom BFH vorgege-benen Vorgehensweise führt zu dem folgenden Ergebnis: 16
Geeignetheitskriterien
• Eine Schätzung ist nur zulässig, wenn eine sichere Tatsachenfeststellung trotz des Bemühens um Aufklärung nicht möglich ist.
• Durch eine Schätzung sollen Besteuerungsgrundlagen durch Wahr-scheinlichkeitsüberlegungen bestimmt werden.
• Im Rahmen des pflichtgemäßen Auswahlermessens des Finanzamts bzw. des FG ist diejenige Schätzungsmethode vorzugswürdig, die der Wirklichkeit nahekommt.
• Es ist zwingend die „geeignetste“ Schätzungsmethode zu verwenden. In-sofern ist das Ermessen der Finanzbehörde nahe bei null.
• Es gibt Schätzungsmethoden, die gegenüber anderen Methoden nach-rangig sein können.
• Das ausschließliche Ziel der Schätzung ist die Erlangung eines Ergeb-nisses, das der Wirklichkeit nahekommt.
• Das mögliche Vorhandensein zusätzlicher Betriebseinnahmen kann durch Verwendung einer Geldverkehrsrechnung überprüft werden.
• Es sind bei Schätzungen „Abstufungen" bei der Vorgehensweise zu be-achten. 17
• Von einer griffweisen Schätzung ist bei der Auflistung alternativer Schät-zungsmethoden nicht die Rede.
Die griffweise Schätzung und die willkürliche Schätzung sind eng miteinander verknüpft. Willkür ist den Rechtssubjekten im Privatrecht - im Rahmen der Rechts-ordnung - gestattet, nicht aber im öffentlichen Recht.18 Dabei ist die Rechtspre-chung zunehmend bürgerfreundlicher geworden: Die Messlatte für die Annahme von Willkür ist vom BFH sehr hoch gesetzt worden. Selbst wenn mehrere grobe Schätzfehler vorliegen, nimmt der BFH noch immer keine Willkür an.19
Als Faustformel gilt: Bereits das „Vorliegen eines einzigen sachlichen Grundes" schließt Willkür bei [S. 319] Gerichtsentscheidungen aus,20 hingegen führt das „Vor-liegen eines sachfremden Grundes"21 bei Verwaltungshandeln22 zur Annahme von Willkür. Hierzu wird auf das Urteil des FG Köln vom 22.5.2014 verwiesen, das eine Ausschließungsmethode verwendet.23 Indizien für eine willkürliche Schätzung sind z.B. im Zeitablauf einer Prüfung unterschiedlich hoch „ermittelte" Sicherheitszu-schläge.24 Das „Vorliegen eines anderen Grundes" als die Ermittlung zutreffender Besteuerungsgrundlagen sollte Anlass sein, das Vorliegen von Willkür zu prüfen. Die Schätzungsdurchführung ist nach der hier vertretenen Rechtsauffassung zweit-zielfeindlich (hierfür könnte man auch den Begriff „mono-destinativ" prägen). Das Verfolgen weiterer Ziele wie z.B.
• Erhöhung des Drucks auf die Einigungsbereitschaft 25 oder
• die Sanktion für Verschulden des Steuerpflichtigen
führt nicht mehr zur gesetzgeberisch gewollten Abbildung der Wirklichkeit des Schätzungsergebnisses.
Bei betriebswirtschaftlicher Betrachtung des Phänomens der Willkür steht im Vor-dergrund die Erlangung von Erkenntnissen im Rahmen eines Erklärungsmodells, in welchen Problembereichen dieses Phänomen verstärkt auftritt und durch welche Handlungsalternativen Willkür vermieden werden kann. Hierzu kann auf die Zu-sammenhänge zwischen Schätzungsmethoden und Bezugsgrundlagen zurückge-griffen werden, die bereits der BFH im Zeitreihenurteil bezüglich der Beurteilung der Treffsicherheit einer Schätzung ansatzweise thematisiert hat: 26
„In diesen Fällen sind andere Schätzungsmethoden, die auf betriebsinternen Da-ten aufbauen oder in anderer Weise die individuellen Verhältnisse des jeweili-gen Steuerpflichtigen berücksichtigen (z.B. Vermögenszuwachs- oder Geldver-kehrsrechnung, Aufschlagkalkulation) grundsätzlich vorrangig heranzuziehen.“ 27
Die Darstellung in Übersicht 3 (Prinzipzeichnung) 28 weist aus, dass
• die Treffgenauigkeit der einzelnen Schätzungsmethoden unterschiedlich hoch ist und insofern eine Vor- und Nachrangigkeit der Methoden besteht [S. 320]
• die Bezugsgrundlagen, auf die die Schätzungsmethoden zurückgreifen, in un-terschiedlicher Höhe valide sind,
• bei der Bezugnahme auf betriebliche Daten und auf die individuellen Verhält-nisse die Gefahr von Willkür gering ist,
• die Verwendung einer „griffweisen Schätzung" nicht nur zu einer niedrigen Treffgenauigkeit, sondern auch zu einer hohen Gefahr von willkürlichem Han-deln führt.
Der Erlass von Steuerbescheiden nach Maßgabe einer griffweisen Schätzung durch die Bp-Stelle ist rechtswidrig, wenn sie Strafcharakter hat. Zum einen ist Amtsanmaßung 29 des verantwortlichen (entscheidungsbefugten) Beamten der Bp-Stelle und zum Zweiten ein Verstoß gegen das grundgesetzlich verankerte Prinzip des Verbots einer Doppelbestrafung - ne bis in idem - zu bedenken.30 Die Doppel-bestrafung ergibt sich in Höhe des Anteils der wegen des Strafcharakters zu hoch festgesetzten Steuer und der festgesetzten Geldbuße. Die Bp-Stellen dienen der „Ermittlung der steuerlichen Verhältnisse" des Steuerpflichtigen, § 194 Abs. 1 Satz 1 AO; für die „Bestrafung der Steuerpflichtigen bei Verletzung von steuerlichen Pflichten" sind die Strafgerichte bzw. die Straf- und Bußgeldstellen zuständig. Steu-erbehörden sind keine Strafbehörden.31 Zum Dritten ergibt sich ein Verstoß gegen das in § 162 Abs. 1 Satz 1 AO normierte alleinige Ziel einer Schätzung „Ermittlung und Berechnung von Besteuerungsgrundlagen" und eben nicht die Legitimierung durch ein weiteres gesetzliches Hauptziel oder Nebenziel „Bestrafung des Steuer-pflichtigen". Strafen ergeben sich aus Urteilen von Strafgerichten bzw. Bußgelder ergeben sich aus Bußgeldbescheiden und eben nicht aus Steuerbescheiden. Die Rechte eines Steuerpflichtigen sind im Strafverfahren anders als im Besteuerungs-verfahren; die Prüfung subjektiver Tatbestandsvoraussetzungen einer Straftat ist etwas anderes als die Ermittlung von Besteuerungsgrundlagen. Zum Vierten haben „Strafschätzungen" enteignungsgleichen Charakter; diese gilt es zu vermeiden.32
Sollte in der Betriebsprüfungspraxis der Gesichtspunkt einer Bestrafung eine Rolle gespielt haben, lässt sich das nur schwer nachweisen. Zudem kann man damit rechnen, dass übergeordnete Stellen und Instanzen einem Betriebsprüfer im Ver-dachtsfalle nach außen hin in der Regel den Rücken stärken werden, allein schon wegen der Außenwirkung. Der Steuerpflichtige ist also auf Indizien angewiesen, was zur Gegenreaktion führt, dass die Betriebsprüfer es tunlichst vermeiden, dass ihr Handeln in die Nähe von strafrechtlichen Erwägungen in Bezug auf den Steuer-pflichtigen gerückt werden kann. Es gibt aber eine Fülle von Indizien und besondere Umstände bei der Durchführung einer Betriebsprüfung, die die Annahme einer griffweisen Schätzung mit Strafcharakter nahelegen, insbesondere, wenn diese sich aufdrängt. 33 Gerade bei einer griffweisen Schätzung ist gegenüber der Ver-wendung geeigneter Schätzungsmethoden wegen des Nichtvorhandenseins nach-prüfbarer Maßstäbe eine Schätzung mit Strafcharakter am leichtesten zu verber-gen.
Das Studium der einschlägigen FG-Urteile lässt erkennen, dass die Finanzgerichte bemüht sind, die griffweisen Schätzungen durch Finanzbehörden zu bestätigen. Dies ist auch verständlich: Eine griffweise Schätzung kann nicht durch eine andere griffweise Schätzung widerlegt werden. Vielfach wird die Befugnis zur griffweisen Schätzung in der Rechtsprechung nicht oder nur knapp begründet, so z.B. vom BFH im Zeitreihenurteil: „Die - ebenfalls äußerst knappen - Ausführungen des FG zur Höhe der Schätzung beschränken sich auf die Aussage, die vom FA angesetz-ten Aufschlagsätze seien geringer als die niedrigsten Aufschlagsätze nach der Richtsatzsammlung, so dass die Schätzung nicht zu beanstanden sei.“ 34 Da bislang eine allseits akzeptierte Operationalisierung von griffweisen Schätzungen fehlt, sind die Urteilsgründe in FG-Urteilen häufig durch Leerformeln geprägt, die dann von anderen Gerichten übernommen werden. In Übersicht 4 werden beispielhaft einige FG-Entscheidungen hierzu angeführt.
FG Düsseldorf vom 12.5.2010, XIV 520/83 | „Die vom Beklagten zugeschätzten Beträge i.H v. 2 % des Umsatzes erscheinen nicht unangemessen hoch." |
FG Köln vom 15.7.20 14, 6 V 1134/14 | Unter Berücksichtigung der Umsatzzuschätzung von 3 v.H. ….ist das Schätzungsergebnis … weder unplausibel noch wirtschaftlich unmöglich. Es begegnet mitdin keinen durchgreifenden Bedenken." |
FG Münster vom 30.6.2005, 12 V 1479/05 | „Der Sicherheitszuschlag … ist ebenfalls nicht zu beanstanden. Er entspricht 3,25 % des erklärten Umsatzes und ist angesichts der Mängel der Kassenführung angemessen." |
FG Köln vom 2. 5. 20071 5 K 4125/06 | „Auch nach der Kenntnis des Senats ist eine Hinzuschätzung von 5 % bei Betrieben der vorliegenden Art durchaus als moderat anzusehen." |
FG Düsseldorf vom 26.3.2012, 6 K 2749/11 | „Die folglich zulässige Hinzuschätzung hat der Beklagte im Ergebnis mit weniger als 10% des erklärten Umsatzes bemessen. Dieses ist im Hinblick auf die festgestellten erheblichen Buchführungsmängel keinesfalls überhöht." |
„Angesichts der Schwere der Verletzung der Aufzeichnungspflicht ist eine Zuschätzung von 10 % der erklärten Erlöse in beiden Streitjahren moderat und vernünftig und hat auch …eine gewisse Wahrscheinlichkeit für ein in der Höhe sachlich ungefähr zutreffendes Ergebnis für sich." | |
FG Nürnberg vom 28.3.2013, 4 K 26/11 | „Angesichts der Schwere der Verletzung der Aufzeichnungspflicht ist eine Zuschätzung von 10 % der erklärten Erlöse in beiden Streitjahren moderat und vernünftig und hat auch …eine gewisse Wahrscheinlichkeit für ein in der Höhe sachlich ungefähr zutreffendes Ergebnis für sich." |
Sächsisches FG vom 4.4.2008, 5 V 1035/07 | „Die Hinzuschätzungen des Antragsgegners betragen für beide Streitjahre jeweils weniger als 10 % des erklärten Umsatzes und sind damit relativ gering ausgefallen." |
FG Neustadt vom 21.9.2012, 3 K 2493/10 | „Die Ableitung des Gewinns in Anlehnung an die Richtsatzsammlung vor dem Hintergrund einer nicht ordnungsgemäßen Buchführung ist vertretbar und angemessen, ebenso ein Sicherheitszuschlag in Höhe von 20% …“ |
FG Düsseldorf vom 28.7.2009, 15 K 829/06 | Das Gericht „setzt mangels anderer Anhaltspunkte griffweise ... einen Sicherheitszuschlag von 20 % des jeweils erklärten Jahresumsatzes an". |
FG Düsseldorf vom 28.3.2008, 11 V 110/08 | „Insgesamt wurde die Hinzuschätzung auf eine Höchstgrenze von 40 % der erklärten Umsätze beschränkt … Die Schätzung ist insgesamt schlüssig und nachvollziehbar." |
Übersicht 4: Beispiele für nur knappe Ausführungen
zur Begründung der Befugnis zur griffweisen Schätzung in ausgewählten FG-Entscheidungen
Im Ergebnis sind die verwendeten Begründungen („ist keinesfalls überhöht“, „ist moderat und vernünftig" „den Schätzungsrahmen keinesfalls überschritten", „ist ver-tretbar und angemessen", „durchaus moderat", „erscheinen nicht unangemessen hoch", „ist insgesamt schlüssig und nachvollziehbar") inhaltsleer. Sie lassen die Darlegung des Abwägungsermessens, vor allem aber die Erörterung von alternati-ven Prozentsätzen und die ausschließliche Orientierung des Schätzungsergebnis-ses an der Wirklichkeit (und z.B. nicht an der Schwere der Buchführungsmängel oder an der wirtschaftlichen Möglichkeit) vermissen. Der Ansatz von 2 % bis 40 % lässt infolge der übergroßen Bandbreite an eine fehlende Bestimmtheit denken, was zur Frage führt, ob Willkür oder gar eine Strafschätzung vorliegt. Soweit mit zwei Stellen hinter dem Komma „griffweise" geschätzt wird (z.B. 3,25% vom Um-satz), handelt es sich um Scheingenauigkeit. Damit die griffweisen Schätzungen den Anforderungen an eine gesetzeskonforme Besteuerung gerecht werden, wäre es erforderlich, deren gesetzliche Grundlagen präzise festzulegen, weil sonst die finanziellen [S. 321] Auswirkungen enorm sind und nach der Erfahrung des Autors manches Lebenswerk zerstört wird. 35
Durch die hohe Bestätigungsquote in FG-UrteiIen 36 wird in der Praxis ein großer Freiraum für die Betriebsprüfer geschaffen, den diese auch nutzen. Vielfach wird auf vorherige Ermittlungen der Besteuerungsgrundlagen, auf die Eingrenzung des Schätzungsbereichs und die Verwendung einer oder mehrerer geeigneter Schät-zungsmethode(n) bzw. die Vornahme einer Teilschätzung verzichtet und relativ schnell eine griffweise Vollschätzung vorgenommen.
Hinweis: Eine Arbeitsverlagerung der Aufgaben der Außenprüfung auf die FG sollte aber nicht hingenommen werden, zumal die Rechte und Pflichten (z.B. § 199 Abs. 2 AO) bei einer Außenprüfung ganz anders als bei einem finanzgerichtli-chen Verfahren gelagert sind. Überdies würde dem Steuerpflichtigen dadurch faktisch eine Instanz genommen und damit eine Schlechterstellung bewirkt.
Es drängt sich daher für den Steuerpflichtigen geradezu auf, beim FG gleich mit der Klageerhebung anzuregen, die Schätzungsbescheide aufzuheben, soweit die noch erforderlichen Ermittlungen erheblich sind (Kassation ohne Sachentscheidung, § 100 Abs. 3 FGO). Dies hat den Charme, dass die FG entlastet und die Betriebsprü-fer ermuntert werden, den Weg der schnellen griffweisen Schätzung und der schnellen Realisierung von Mehrsteuern zu verlassen.
Der Sicherheitszuschlag ist das Verhandlungsergebnis zwischen Finanzbehörde und Steuerpflichtigem nach Maßgabe einer griffweisen Schätzung auf der Basis einer einvernehmlichen Bezugsgrundlage und eines Prozentsatzes im Wege einer drastischen Vereinfachung (oversimplification). Nicht einvernehmliche griffweise Schätzungen auf Basis der Verwendung von Gemeinplätzen („erscheint ange-messen“ u.Ä.) nebst Bezugnahme auf andere vergleichbare gerichtliche Entschei-dungen sind nach der hier vertretenen Auffassung unzulässig, insbesondere, wenn vorherige Ermittlungen unterblieben oder der Schätzungsbereich nicht eingegrenzt wurde oder nicht alle bedeutsamen Umstände berücksichtigt wurden oder eine ge-eignete Schätzungsmethode nicht zur Verfügung steht. Keinesfalls darf die griff-weise Schätzung einen subjektiven oder objektiven Willkürakt darstellen. [S. 322]
Der Sicherheitszuschlag kann auch nicht zur Plausibilisierung einer geeigneten Schätzungsmethode herangezogen werden. Die Vielzahl der veröffentlichten FG-Entscheidungen mit Prozentzahlen bezüglich Sicherheitszuschlägen stellt ein Zerr-bild dar, da ein Vielfaches von Einigungen in der beruflichen Praxis mit wesentlich niedrigeren Prozentzahlen nicht den Weg in die Öffentlichkeit findet.
Der Sicherheitszuschlag als multiplikative Verknüpfung zwischen Prozentsatz und (vermeintlich falsch erklärtem) Umsatz beruht bezüglich beider Faktoren nicht auf einer validen betriebsinternen Datenbasis. Unter Anwendung der im Zeitreihenurteil niedergelegten Grundsätze (Vorziehenswürdigkeit der Methoden mit Bezug auf die betriebsinterne Datenbasis und Vermeidung von Methoden mit starker Hebelwir-kung) ist die Anwendung eines Sicherheitszuschlags keine „geeignete Schät-zungsmethode" 37 und birgt eine hohe Gefahr von willkürlichem Verwaltungshan-deln.
Lägen in strukturierter Weise klar definierte Grundsätze ordnungsmäßiger Durchführung von Schätzungen vor, würde es den betroffenen Unternehmern und ihren Steuerberatern leichter fallen, unberechtigten Schätzungen durch die Finanzbehörden entgegenzutreten und Konsequenzen bei der Verletzung rechtlicher Vorschriften und Maßstäbe, die an die Ordnungsmäßigkeit einer Schätzung anzulegen sind, aufzuzeigen. Der folgende Beitrag sammelt, sichtet, ordnet und formuliert solche Grundsätze und zeigt Lösungen bei Verstößen auf.
Der Verfasser ist selbständiger Steuerberater in Köln.
Nach § 162 i.V.m. § 158 AO ist im Fall der „sachlichen“ Unrichtigkeit einer Buchführung zu schätzen. Bei nur formellen Mängeln ist keine Schätzungsbefugnis gegeben; a.A. R 29 Abs. 2 EStR 2012. Hier dürfen die formellen Mängel das sachliche Ergebnis nicht beeinflussen, was ein Widerspruch in sich ist. Der Begriff „sachliches Ergebnis“ bezieht sich auf Steuerbemessungsgrundlagen, insbesondere auf Umsatz und Gewinn; bei Auswirkungen hierauf liegen „materielle Mängel“ vor. Die Richtlinien unterscheiden ferner zwischen „unwesentlichen" materiellen Mängeln (keine Schätzungsbefugnis) und „schwerwiegenden" materiellen Mängeln (Vollschätzungsbefugnis). Im Folgenden wird aus Vereinfachungsgründen kein Unterschied bezüglich unterschiedlicher Gewinnermittlungsarten bzw. zwischen Buchführung und Aufzeichnungen gemacht.
1. Allgemeine Rechtsgrundlagen der GoB
Hinblick auf Organisation, technischen Fortschritt und Rechtsprechung unterliegen. Bezüglich des Begriffs der „handelsrechtlichen Grundsätze ordnungsmäßiger Buchführung" kann auf die Verwendung in § 5 Abs. 1 Satz 1 EStG sowie auf § 243 Abs. 1 HGB Bezug genommen werden. Die GoB ergeben sich aus kaufmännischer Übung (Handelsbrauch, Verkehrsanschauung) sowie aus Einzelvorschriften des HGB (insbesondere §§ 238, 239, 257 und 261 HGB) und der AO (§§ 145 bis 147 AO), ferner in ausufernder Weise durch Verwaltungsanweisungen (z.B. R 29 EStR 1993, GDPdU, GoS, GoBS, GoBD, GoBIT) sowie aus gerichtlichen Entscheidungen.
2. Ableitung der GoDS analog zu den GoB
Die GoDS lassen sich demgegenüber rechtsdogmatisch aus dem Rechtsstaatprinzip in Art. 20 Abs. 3 GG sowie aus dem Gleichheitsgebot in Art. 3 Abs. 1 GG ableiten, denn diese verfassungsrechtlichen Vorgaben schließen eine willkürliche Besteuerungspraxis bzw. Betriebsprüfungspraxis aus, indem sie die Steuerverwaltung an die Prinzipien der rechtsstaatlichen Ordnung des Grundgesetzes, das Verwaltungshandeln also an „Gesetz und Recht“ binden und zugleich eine gleichmäßige Anwendung der Steuergesetze gegenüber allen Steuerpflichtigen verlangen.3 Die Steuerpflichtigen erwarten darüber hinaus auch rein persönlich als Beleg für eine kalkulierbare und faire Rechtsordnung gerade in Situationen wie einer Betriebsprüfung, bei denen es vielfach zu Schätzungen kommt, die Behandlung „auf gleicher Augenhöhe". Das heißt, sie akzeptieren ganz im Sinne des Rechtsstaatsprinzips (Art. 20 Abs. 3 GG) keine intransparente Verwaltungspraxis, die nicht anhand der Rechtsordnung und daraus ableitbaren zuverlässigen Kriterien von ihnen auf Richtigkeit überprüft werden kann. Nur einer an transparenten und an klaren rechtlichen Maßstäben ausgerichteten Rechtsausübung der Verwaltung kann der Steuerpflichtige eine nicht rechtskonforme Verwaltungsentscheidung mit der Ausübung eigener Rechte wirksam begegnen und entsprechend mit Rechtsbehelfen angemessen angreifen. Die Steuerpflichtigen erwarten also die vom Rechtsstaatsprinzip intendierte Transparenz und Nachvollziehbarkeit des Verwaltungshandelns, [S. 389]die wiederum Voraussetzung rechtlicher Chancengleichheit zwischen dem Steuerpflichtigen und den Entscheidungsträgern der Finanzbehörde ist, denn nur dann sind beide Seiten ebenbürtig in der Ausübung der ihnen vom Gesetz jeweils zugewiesenen Rechte. Da für GoDS bislang bzw. in absehbarer Zeit weder eine spezielle gesetzliche Regelung noch Verwaltungsanweisung existiert bzw. existieren wird, ist
3 Vgl. Hey in Tipke/Lang, 22. Aufl. 2015, § 3 Rz. 90, 111.
4 Dieser Bereich könnte durch empirische Erhebungen von Universitäten konkretisiert werden.
Zu unterscheiden sind Grundsätze materieller und Grundsätze formeller Art. In formeller Hinsicht gelten die folgenden Prinzipien:
Grundsätze
1. Grundsatz der Klarheit und Übersichtlichkeit,
2. Grundsatz der Vollständigkeit,
3. Grundsatz der Dokumentation,
4. Grundsatz der Unveränderbarkeit,
5. Grundsatz der Informationsgleichheit.
Verstöße gegen diese formellen Grundsätze führen zur Behinderung der Überprüfung einer Schätzung und berechtigen den Steuerpflichtigen, die Behörde aufzufordern, den Mangel abzustellen oder die Schätzung zurückzunehmen. In materieller Hinsicht sind darüber hinaus die folgenden Prinzipien zu beachten: 6. Grundsatz der Separation,
7. Grundsatz der Geeignetheit,
8. Grundsatz der Verhältnismäßigkeit,
9. Grundsatz der Wahrheit,
10. Grundsatz des Willkürverbots.
Verstöße gegen diese materiellen Grundsätze führen, je nach sachlichem Gewicht, zur partiellen oder vollständigen Verwerfung einer Schätzung.
1. Grundsatz der Klarheit und Übersichtlichkeit
Nach § 243 Abs. 2 HGB muss der Jahresabschluss „klar und übersichtlich sein". Was für den Jahresabschluss gilt, muss erst recht für die Schätzungsdurchführung als Ersatzhandlung gelten, wenn der Gewinn durch den Jahresabschluss nicht in zutreffender Höhe ermittelt wurde oder werden kann. Der vorstehende Grundsatz erfordert, dass
• die Gliederung der Berechnung logisch aufgebaut ist und den Sachzusammenhang erkennen lässt,
• die Herkunft der verwendeten Daten bezeichnet ist,
• Postenzusammenfassungen nahe liegend und erläutert sind (wichtig bei der Nachkalkulation),
• alle Abkürzungen in der Prüferhandakte und in Tabellen eindeutig sind,
• nicht allgemein übliche Abkürzungen erläutert sind.
Maßstab für die Einhaltung dieses Grundsatzes ist in analoger Anwendung von § 145 Abs. 1 Satz 1 AO, § 238 Abs. 1 Satz 2, § 243 Abs. 2 HGB nicht nur, ob sich ein sachverständiger Dritter innerhalb angemessener Zeit einen Überblick über die Schätzungsdurchführung verschaffen kann, sondern dass auch die Erläuterungen der Schätzung für das Verständnis des Schätzungsadressaten ausreichend sind, § 200 Abs. 1 Satz 2 AO analog.
2. Grundsatz der Vollständigkeit
Dieser Grundsatz ergibt sich unmittelbar aus § 162 Abs. 1 Satz 2 AO, wonach „alle" bedeutsamen Umstände zu berücksichtigen sind. Er besagt zum einen, dass alle relevanten Umstände für die Herleitung des Schätzungsergebnisses tatsächlich einbezogen werden oder der Verzicht hierauf begründet wird. Der Begriff „Umstände" umfasst bei Anwendung einer Schätzungsmethode neben der Berücksichtigung des feststehenden (sicheren) Zahlenwerks - z.B. die Höhe der unbaren Privatentnahmen - die Berücksichtigung aller Begleitumstände bei der Abwägung und Festlegung des unsicheren Teils eines Zahlenwerks. Häufig sind es die Begleitumstände eines Sachverhalts (Zusammenhänge, Abhängigkeiten, Motive, Ergänzungen, Fehleinschätzungen, ethnische oder religiöse Einflüsse), die diesen in einem anderen Licht erscheinen lassen.
Es sollte daher beanstandet werden, wenn der Prüfer nicht den gesamten Prüfungszeitraum (sondern nur einige Monate) und/oder nicht alle Leistungen (z.B. keine Speiseumsätze) in eine Schätzungsdurchführung einbezieht. Im Zweifelsfall ist vom Prüfer detailliert zu begründen, warum eine Hochrechnung gerechtfertigt ist und zu welchem Ergebnis bei Anwendung bestimmter Schätzungsmethoden eine Vergleichsrechnung (Sensitivitätsanalyse)5 kommt. Der Grundsatz der Vollständigkeit besagt zum anderen, dass das Zahlenwerk nach Maßgabe einer Schätzungsmethode vollständig offengelegt wird sowie der Inhalt der Prüferakten als Teil der Finanzamtsakten vollständig ist, also keine Geheimakten geführt werden, und dass kein Austausch von Blättern erfolgt ist. [S. 390]
5 Vgl. BFH vom 25.3.2015, X R 20/13, BStBI II 2015 S. 743, Rz. 69.
3. Grundsatz der Dokumentation
Dieser Grundsatz besagt, dass der Steuerpflichtige „während" der Außenprüfung über die von der Finanzbehörde festgestellten Sachverhalte und deren mögliche steuerliche Auswirkungen zu unterrichten ist (§ 199 Abs. 2 AO), und zwar in der Weise, dass ihm die Überprüfung der Schätzung möglich und erleichtert wird. Erfolgt dies nicht, kann dies einen massiven Behinderungsgrund und damit einen erheblichen Mangel der Schätzungsdurchführung darstellen (mit der Möglichkeit der Heilung nach § 126 Abs. 1 Nr. 3 AO). Die Ablehnung der Herausgabe von Kopien ist - wie die Ablehnung der Schlussbesprechung - ein Verwaltungsakt.6 Insbesondere müssen Buchführungsmängel, die zur Schätzungsbefugnis führen, sowie Berechnungsgrundlagen und Auswertungsregeln bei Schätzungen in nachvollziehbarer Weise spätestens im Prüfungsbericht und im Detail in den Prüferhandakten ausreichend dokumentiert sein.7 „Nicht selten sprechen Gerichte dem Finanzamt die Schätzungsbefugnis ... schon auf Grund einer nicht ausreichenden Dokumentation der Mängel im Nachhinein ab ... Die sich aus der Nichtdokumentation von Mängeln ergebenden Unsicherheiten gehen zu Lasten der Finanzbehörde."8 Schätzungen sind in vollem Umfang durch den Steuerpflichtigen, aber auch durch das FG überprüfbar, § 96 Abs. 1 Satz 1 FGO i. V. m. § 162 AO. Dazu reicht es nicht, die Prüfersicht anhören zu dürfen oder den Prüfer zur Schätzung nur mündlich in einer angebotenen Besprechung befragen zu können.
6 Gleicher Auffassung BFH vom 16.12.1987, I R 66/84, BFH/NV 1988 S. 319.
7 Vgl. FG Niedersachsen vom 17.11.2009, 15 K 12031/08, www.stotax-first.de.
8 Vgl. Achilles, Kassenprüfung, in bargeldintensiven Unternehmen, 2014, S. 259 unter Hinweis auf das Urteil des FG des Saarlandes vom 28.7.1983,I 280-281/82, I 280/82, I 281/82, EFG 1984 S. 5.
4. Grundsatz der Unveränderbarkeit
Dieser Grundsatz verlangt, dass Aufzeichnungen des Prüfers bis zur Rechtskraft in der Prüferhandakte bzw. in PCs nicht verändert werden können, so dass der ursprüngliche Inhalt jederzeit feststellbar ist. Er folgt aus analoger Anwendung von § 239 Abs. 3 HGB, § 146 Abs. 4 AO. Unveränderbarkeit verlangen Prüfer von den Aufzeichnungen und digitalen Speicherungen auf Ebene der Steuerpflichtigen. Andererseits verwenden Prüfer vielfach Bleistiftnotizen in der Prüferhandakte und Radiergummi; ferner werden digitale Notizen nebst Druckdatum nicht ausgedruckt und nicht zu den Prüferhandakten genommen. Dies sollte nicht hingenommen werden. Wer eine Schätzung überprüft, sollte nicht nur das Ergebnis der Schätzung, sondern auch die zeitliche Abfolge und die Wirkung von Veränderungen sehen und beurteilen können.
Wenn ein Prüfer eine Aufschlagskalkulation durchführt und zum Schluss feststellt, dass die Abweichungen von den erklärten Besteuerungsgrundlagen weniger als 10% betragen (= Unschärfebereich), später aber die Parameter so ändert, dass die Abweichungen mehr als 10% betragen, sollte die Entstehung des präsentierten Schätzungsergebnisses für den Steuerpflichtigen und für das FG erkennbar sein.
5. Grundsatz der Informationsgleichheit
Dieser Grundsatz besagt, dass die asymmetrische Informationsverteilung9 zwischen Prüfer und Geprüften (d. h. der einseitige Wissensvorsprung der Finanzbe-hörde) zu einem möglichst frühen Zeitpunkt behoben werden sollte.10 Es bestehen folgende Anknüpfungspunkte:
Checkliste - Informationspflichten der Finanzbehörde
• Unterrichtungsverpflichtung der Finanzbehörde „während" der Außenprüfung über die von der Finanzbehörde festgestellten Sachverhalte und deren mögliche steuerliche Auswirkungen (§ 199 Abs. 2 AO).11
• Dokumentationsverpflichtung der Finanzbehörde in Bezug auf Darstellung der Buchführungsmängel, der Berechnungsgrundlagen und der Auswertungsregeln im Prüfungsbericht und im Detail in den Prüferhandakten.12
• Recht auf Erörterung strittiger Sachverhalte sowie der rechtlichen Beurteilung der Prüfungsfeststellungen und ihrer steuerlichen Auswirkungen im Rahmen einer Schlussbesprechung (§ 201 Abs. 1 Satz 2 AO). [S. 391]
• Recht auf Stellungnahme zu den Prüfungsfeststellungen in tatsächlicher und rechtlicher Hinsicht nach Z usendung des Betriebsprüfer-Berichts gegenüber der Betriebsprüfer-Stelle (§ 201 Abs. 2 Satz 2 AO).13
Die relevanten Informationen zur Überprüfung der Schätzung werden nach den Erfahrungen des Verfassers dem Steuerpflichtigen bisweilen nur stückweise, also nach und nach, zur Verfügung gestellt. Es empfiehlt sich, den Personenkreis und die Kompetenz der Stellen auszuloten, bei denen sich die Einholung weiterer Informationen lohnt bzw. nicht lohnt. Folgende Zugangswege mit der Möglichkeit, Informationen zu beschaffen, kommen bis zur eingetretenen Rechtskraft - solange also der Beurteilungsprozess in Bezug auf eine Schätzung dauert - ergänzend in Betracht:
• Veranlagungsstelle: Recht auf Gehör bei der vor Erlass der Steuerbescheide in Bezug auf die für die Entscheidung erheblichen Tatsachen, § 91 Abs. 1 Satz 1 AO,
• Rechtsbehelfsstelle: Recht auf Gelegenheit zur Äußerung im Einspruchsverfahren, § 367 Abs. 2 Satz 2 AO,
• Finanzgericht: Akteneinsichtsrecht, §§ 78, 86 FGO, Äußerungsrecht in Bezug auf Tatsachen und Beweisergebnisse, § 96 Abs. 2 FGO.
Diese Regelungen dienen dazu, ein möglichst faires Verwaltungs- und Gerichtsverfahren zu bewirken, wobei eine möglichst gleiche Informiertheit des Gerichts, des Klägers (Steuerpflichtigen) und des Beklagten (Finanzbehörde) angestrebt wird.
Das Recht auf Akteneinsicht hat der Steuerpflichtige während der Betriebsprüfung und dem nachfolgenden Verwaltungsverfahren (noch) nicht. Gleichwohl kann er gezielt nach derartigen Informationen fragen, denn die Finanzbehörde hat das Recht, diese Informationen bereits im Vorfeld zu geben. Nach den Erfahrungen des Autors wird bei Außenprüfungen und bei den nachfolgenden Verfahren durch den freiwilligen Verzicht auf umfassende und vollständige Information unnötig eine erhebliche Erschwernis der Gegenargumentation des Steuerpflichtigen bewirkt. Anhören ist mehr als „zur Kenntnis nehmen" und umfasst auch die Prüfung und Wertung der Äußerung. Wenn im Prüfungsbericht einseitig nur die Mängel der Kassenführung bzw. der Buchführung (und eben nicht die ordnungsgemäßen Teile) und auch keine für den Steuerpflichtigen positiven Überprüfungen aufgelistet werden, führt dies letztlich zu einem Zerrbild. Dies kann eine massive Behinderung der Überprüfung darstellen. Je eher vollständige Informationen als bedeutsamstes Verfahrensrecht gegeben werden, umso fairer verläuft die Prüfung. Die Vorlage- und Informationspflicht der Behörde dient dem verfassungsrechtlichen Grundsatz effektiven Rechtsschutzes nach Art. 19 Abs.4 GG und stellt einen Schutzmechanismus für den weniger informierten Steuerpflichtigen dar. Allerdings werden im Vorfeld seitens der Finanzbehörde folgende Informationen z.B. selten oder nicht erteilt: Checkliste - Informationen, die häufig nicht mitgeteilt werden
• anonyme Anzeigen,
• Kontrollmitteilungen, Auskunftsersuchen,
• weitere (alternative) Berechnungen und Aufzeichnungen des Prüfers und des Sachgebietsleiters, insbesondere Entwürfe von Schriftsätzen und interne Aktenvermerke,
• ergänzende Anwendung von weiteren Schätzungs- und Verprobungsmethoden.
9 Es handelt sich ursprünglich um einen wirtschaftswissenschaftlichen Begriff, der meist in der Prinzipal-Agent-Theorie thematisiert wird. Hierbei verfügt der Prinzipal über weniger Informationen als der Agent, was zu bedeutsamen Konsequenzen führt. Bezogen auf Schätzungsdurchführungen kennt nur der Prüfer bestimmte „ hidden characteristics " (verborgene Eigenschaften, wie Schwächen seiner Nachkalkulation), so dass der Steuerpflichtige bei der Schätzungsüberprüfung nicht die Qualität der Schätzung beurteilen kann. Daher besteht die Gefahr, dass es zur Erreichung dieses Ziels zu einer „adversen Selektion" (nachteiligen Auswahl) kommt, dass z.B. systematisch die Darstellung unerwünschter (für den Steuerpflichtigen) positiver Verhältnisse sowie angreifbarer Schwächen der eigenen Berechnung, wie z.B. eine für den Fiskus ungünstige Sensitivitätsanalyse, in einem Bp-Bericht unterbleiben. Dies führt letztlich zu einem Zerrbild, das trotzdem die Berichtsadressaten (Steuerpflichtiger, Veranlagungsstelle, Finanzgericht) im gewünschten Sinne zu beeindrucken vermag.
10 Auf dieses Dilemma ungleicher Informationsverteilung weist der BFH im Zeitreihenurteil (BFH vom 25.3.2015, X R
20/13, BStBI II 2015 S. 743) ausdrücklich hin: Der Steuerpflichtige stehe nach Ansicht der Finanzbehörde in der Pflicht, ‚Auffälligkeiten' in den Ergebnissen des Zahlenwerks zu erklären bzw. zu widerlegen, verfügt aber, ohne dass ihm dies rechtlich vorzuwerfen wäre, möglicherweise gar nicht über das umfangreiche Zahlenmaterial - oder auch über das statistischmethodische Wissen -, das erforderlich wäre, um eine sachgerechte Analyse der Datenmengen vornehmen zu können".
11 In BFH vom 17.11.1981, VIII R 174/77, BStBI II 1982 S. 430, 434, heißt es unter Bezugnahme auf das rechtliche Gehör entsprechend § 91 AO: „Offenzulegen ist nicht nur das rechnerische Ergebnis der Nachkalkulation; auf Verlangen sind auch die Ermittlungen, die zu diesem Ergebnis geführt haben, bekanntzugeben". Insbesondere muss der Steuerpflichtige „Gelegenheit erhalten, das Rechenwerk des Betriebsprüfers bis auf seine Ursprünge zu verfolgen", und zwar bezüglich Abweichungen bei den „entscheidungserheblichen Tatsachen zur vorherigen Äußerung". Die Ablehnung der Herausgabe von Kopien ist - wie die Ablehnung der Schlussbesprechung - ein Verwaltungsakt, gleicher Auffassung BFH vom 16.12.1987, I R 66/84, BFH/NV 1988 S. 319.
12 FG Niedersachsen vom 17.11 2009, 15 K 12031/08, www.stotax-first.de.
13 Die hiernach korrespondierende Anhörungsverpflichtung der Finanzbehörde umfasst Annahme, Prüfung und Wertung der Stellungnahme. Eine sich hiernach ergebende Erörterungspflicht kann sich aus der Sachverhaltsaufklärungspflicht bzw. dem Untersuchungsgrundsatz (§ 88 Abs. 1 AO) sowie der Fürsorgepflicht gem. § 89 Abs. 1 Satz 1 AO ergeben. Werden entscheidungserhebliche Argumente des Steuerpflichtigen beim Erlass des Steuerbescheids nicht gewertet, ist der Anspruch auf rechtliches Gehör verletzt (ähnlich BVerfG vom 3.4.1979, 1 BvR 733/78, BVerfGE 51 S. 126, 129).
6. Grundsatz der Separation
14 Insbesondere Mängel in den Kassenaufzeichnungen haben in der Praxis eine hohe Bedeutung. Vgl. hierzu ausführlich Barthel, Schätzung aufgrund von Kassenmängeln, StBp 2016 S. 80.
15 Bei einer Schätzung sind die verwertbaren Teile der Buchführung zu berücksichtigen bzw. einzubeziehen, so dass das erklärte Ergebnis der Buchführung durch eine Ergänzungsschätzung richtiggestellt werden kann, BFH vom
13.10.1976, I R 67/75, BStBI II 1977 S. 260.
16 Eine Vollschätzung kann nur erfolgen, wenn keine Unterlagen vorgelegt werden oder die Buchführung insgesamt kein Vertrauen genießt, BFH vom 15.4.1999, IV R 68/98, BStBI II 1999 S. 481. Diese Messlatte hat der BFH sehr hoch gelegt; die Mängel müssen schon gravierend sein.
7. Grundsatz der Geeignetheit
Dieser Grundsatz erfordert durch den Prüfer die Anwendung einer geeigneten Schätzungsmethode; liegen mehrere geeignete Methoden vor, ist zumindest die bessere Methode zu wählen oder es sind alle geeigneten Methoden zu verwenden. Eine Eignung ist nur gegeben, wenn die Methode kausal das Ziel einer zutreffenden Ermittlung[S. 392]] der Besteuerungsgrundlagen bewirkt. Dieser Grundsatz wird mehrfach im Zeitreihenurteil des BFH vom 25.3.2015 angesprochen: „Die aufgezeigten Problembereiche lassen ... erkennen, dass der Zeitreihenvergleich für bestimmte Betriebstypen oder bestimmte betriebliche Situationen schon dem Grunde nach keine geeignete Schätzungsmethode darstellt. ... Sofern der Zeitreihenvergleich dem Grunde nach eine geeignete Verprobungsmethode darstellt, kann er gleichwohl gegenüber anderen Methoden nachrangig sein."17 Die hierzu erfolgten Abwägungen des Prüfers müssen nachprüfbar dokumentiert und nachvollziehbar sein.
17 BFH vom 25.3.2015, X R 20/13, BStBI II 2015 S. 743, Rz.55 bis 59. Nach dieser Entscheidung „sind andere Schätzungsmethoden, die auf betriebsinternen Daten aufbauen oder in anderer Weise die individuellen Verhältnisse des jeweiligen steuerpflichtigen berücksichtigen (z.B. Vermögenszuwachs- oder Geldverkehrsrechnung, Aufschlagkalkulation) grundsätzlich vorrangig heranzuziehen“, Rz. 64. Ferner ist nach Rz. 67 bei Unsicherheiten (hier: auf Grund der Hebelwirkung einer Schätzungsmethode) „eine Plausibilitätsprüfung ... vorzunehmen, die sich nicht allein auf einen summarischen Vergleich mit den amtlichen Richtsätzen beschränken darf.“ Die zuletzt genannte Methode kann somit allenfalls nachrangig herangezogen werden.
| 8. Grundsatz der Verhältnismäßigkeit
Rechtsdogmatisch hat dieser Grundsatz als allgemeines Abwägungsprinzip seine Grundlage im Rechtsstaatsprinzip des Art. 20 Abs. 3 GG. Dieser Grundsatz wird explizit in § 2 Abs. 1 Satz 2 BPO 200018 und im Zeitreihenurteil des BFH19 angesprochen. Die Anwendung des Verhältnismäßigkeitsgebots (auch: Übermaßverbot) durchzieht das gesamte Steuerrecht als Teil des Verwaltungsrechts, insbesondere in Bezug auf Ermessens- und Abwägungsentscheidungen. Hieraus folgen unmittelbar die Versagung einer Schätzungsbefugnis in Bagatellfällen, aber auch das Erfordernis der Angemessenheit (Übermaßverbot), was eine Skalierbarkeit von Prozentsätzen20 bei der „Ableitung" eines Sicherheitszuschlags voraussetzt. Dieser Grundsatz bezieht sich auf die verwendete(n) Schätzungsmethode(n) im Hinblick auf den Zeiteinsatz der Prüfung und Überprüfung, auf die Sicherheit der Schätzungsgrundlagen sowie auf die Anlegung von Maßstäben in Bezug auf die Höhe der einfließenden Parameter.
18 Allgemeine Verwaltungsvorschrift für die Betriebsprüfung - Betriebsprüferordnung (BpO 2000) vom 15.3.2000, BStBI I 2000 S. 368, zuletzt geändert durch die allgemeine Verwaltungsvorschrift vom 20.7.2011, BStBI I 2011 S. 710.
19 BFH vom 25.3.2015, X R 20/13, BStBI II 2015 S. 743, Rz. 60.
20 Die Anwendung von Bagatellgrenzen ist ein wichtiger Bestandteil der BFH-Rechtsprechung.
9. Grundsatz der Wahrheit
Dieser Grundsatz ergibt sich aus analoger Anwendung des § 150 Abs. 2 AO. Hiernach sind „die Angaben in den Steuererklärungen ... wahrheitsgemäß nach bestem Wissen und Gewissen zu machen". Diese Angaben des Steuerpflichtigen sind im Regelfall der Besteuerung zu Grunde zu legen, ebenso wie im Ausnahmefall anstelle der Angaben das Ergebnis einer berechtigten Schätzung durch die Finanzbehörde. Dieser Grundsatz ist verletzt, wenn der Prüfer einseitig (also nicht gem. § 199 Abs. 1 AO zu Gunsten wie zu Ungunsten des Steuerpflichtigen) prüft oder die Schätzungsgrundlagen (Annahmen, Daten, Berechnungsgrundlagen) keine Übereinstimmung mit der Wirklichkeit aufweisen. Der Grundsatz impliziert, dass stets die größtmögliche Wahrscheinlichkeit (Treffsicherheit) für eine Sachverhaltsannahme oder -unterstellung anzustreben ist,21 dass also das Schätzungsergebnis der Wahrheit bzw. der Realität am nächsten kommt. Deshalb sind Strafschätzungen oder Schätzungen mit Bezug auf den Grad des Verschuldens des Steuerpflichtigen contra legem. Liegen z.B. keine Unterlagen für einen Besteuerungsabschnitt vor, macht es für das Schätzungsergebnis keinen Unterschied, ob diese Unterlagen (schuldlos) verbrannt sind oder (vorsätzlich) vernichtet wurden.22
Dabei ist die Unwahrheit von einem Irrtum abzugrenzen. Ein Irrtum liegt vor, wenn der Prüfer von der Wahrheit seiner Angaben überzeugt ist, obgleich diese sich als falsch erweisen: Insoweit ist die Schätzung (partiell) zu berichtigen. Liegt Unwahrheit vor, ist von der Voreingenommenheit des Prüfers auszugehen und seine Schätzung insgesamt zu verwerfen.
21 Vgl. BFH vom 26.2.2002, X R 59/98, BStBI II 2002 S. 450, 452. Vgl. hierzu ferner das Zeitreihenurteil, BFH vom
25.3.2015, X R 20/13, BStBI II 2015 S. 743.
22 Bei vorsätzlicher Vernichtung der Unterlagen wird aber die strafrechtliche Würdigung unumgänglich sein. Es gilt uneingeschränkt der Grundsatz „ne bis in idem", Art. 103 Abs. 3 GG.
10. Grundsatz des Willkürverbots
Rechtsdogmatisch leitet sich das Willkürverbot aus Art. 20 Abs. 3 GG i.V.m. dem allgemeinen Gleichheitssatz des Art. 3 Abs. 1 GG ab. Das Willkürverbot greift nicht in Bereichen, in denen ein Rechtssubjekt im Rahmen der Rechtsordnung ungebunden und frei handeln kann, ohne dabei Regeln und allgemein gültige Entscheidungskriterien beachten zu müssen. So können Bürger im Privatleben in vielen Bereichen zulässig willkürliche Entscheidungen treffen, ohne dadurch mit dem Gesetz in Konflikt zu geraten. Der Gegensatz zum Bereich der zulässigen Willkür besteht in der Notwendigkeit, in bestimmter Weise oder in einem festgelegten Rahmen verfahren zu müssen, um rechtskonform zu handeln; diese Verpflichtung und Notwendigkeit ergibt sich bei Behörden wegen der Bindung an das Gemeinwohl (salus rei publicae) für jedes hoheitliche Handeln, so dass ein rechtsgrundloser Eingriff in Rechte eines Bürgers gem. Art. 20 Abs. 3 GG als unzulässige willkürliche Maßnahme ein Verstoß gegen das Willkürverbot und damit rechtswidrig ist. Rechtswidrige Willkür ist wegen des Gleichbehandlungsgebots des Art. 3 Abs. 1 GG darüber hinaus jede ungleichmäßige Rechtsanwendung einer Behörde „ohne Grund" oder „ohne sachlichen Grund".23 Auch ein Unterlassen kann willkürlich sein, so etwa, wenn die Finanzbehörde ohne sachlichen Grund die Überprüfung einer Entscheidung durch den Steuerpflichtigen behindert und vereitelt, indem sie einem Steuerpflichtigen den Informationszugang verweigert oder auf Dokumentation verzichtet unter Missachtung des in § 199 Abs. 1 AO enthaltenen [S. 393] Grundsatzes, dass der Außenprüfer sowohl die für den Steuerpflichtigen günstigen als auch die für ihn ungünstigen Umstände ermitteln muss.24
Der Begriff „Willkür" ist dabei von bloß fehlerhaftem hoheitlichen Handeln abzugrenzen.25 Nach der Rechtsprechung des BVerfG26 liegt Willkür vor, wenn sich mangels Vorliegens eines sachlichen Grunds der Schluss aufdrängt, dass die Rechtsanwendung auf sachfremden Erwägungen beruht. Dabei bleibt offen, ob bereits ein einziger möglicher sachlicher Grund die Annahme von Willkür ausschließt, weil sich im Hinblick auf die Komplexität der Rechtsordnung und der Lebenssachverhalte immer ein sachlicher Grund für ein bestimmtes hoheitliches Handeln finden lässt. Nach der hier vertretenen Auffassung ist auf die Gesamtumstände abzustellen und es sind die nahe liegenden sachlichen und sachfremden Gründe gegeneinander abzuwägen. Grundlegend in Bezug auf die Annahme von Willkür bei Schätzungen durch Finanzbehörden ist das Urteil des FG Köln vom 22.5.2014.27 Indiz für eine willkürliche Schätzung sind z.B. die im Zeitablauf einer Prüfung sehr unterschiedlich hoch „ermittelten" Sicherheitszuschläge.28 Willkür liegt ferner vor, wenn die Finanzbehörde „griffweise" schätzt bzw. nach § 287 ZPO eine tatrichterliche Schätzung unter „Würdigung aller Umstände" unter Verzicht auf eine methodische Fundierung erfolgt, obgleich geeignete Schätzungsmethoden zur Verfügung stehen. Die bloße Benennung der Höhe eines Prozentsatzes für einen Sicherheitszuschlag ist willkürlich, wenn auf eine geeignete Schätzungsmethode verzichtet wurde.
23 Der Begriff „Willkür" enthält keinen subjektiven Schuldvorwurf und wird z.B. wertneutral im Rahmen des „gewillkürten Betriebsvermögen" (im Gegensatz zum notwendigen Betriebsvermögen) bzw. bei der „gewillkürten Prozessstandschaft" (im Gegensatz zur gesetzlichen Prozessstandschaft) verwendet.
24 In BFH vom 17.11.1981, VIII R 174/77, BStBl II 1982 S. 430, 434, heißt es unter Bezugnahme auf das rechtliche Gehör entsprechend § 205 Abs. 3, § 91 AO: „Offenzulegen ist nicht nur das rechnerische Ergebnis der Nachkalkulation; auf Verlangen sind auch die Ermittlungen, die zu diesem Ergebnis geführt haben, bekanntzugeben". Insbesondere muss der Steuerpflichtige „Gelegenheit erhalten, das Rechenwerk des Betriebsprüfers bis auf seine Ursprünge zu verfolgen", und zwar bezüglich Abweichungen bei den „entscheidungserheblichen Tatsachen zur vorherigen Äuße-rung“.
25 In BFH vom 30.8.2007, II B 90/06, BFH/NV 2008 S. 13, differenziert der BFH zwischen einem „groben Schätzungsfehler" (dieser führt zur Nichtigkeit, wenn die Finanzbehörde bewusst und willkürlich schätzt) und einem „besonders schwerwiegenden Fehler" i.S.d. § 125 AO, der lediglich offenkundig sein muss.
26 Vgl. BVerfG vom 28.7.2015, 2 BvR 2558/14, NJW 2015 S. 2949. Hiernach ist Willkür bei einem Verfahren z.B. anzunehmen, wenn eine offensichtlich einschlägige Norm nicht berücksichtigt oder der Inhalt einer Norm in krasser Weise missdeutet wird ... Von einer willkürlichen Missdeutung kann hingegen nicht gesprochen werden, wenn das Gericht sich mit der Rechtslage eingehend auseinandersetzt und seine Auffassung nicht jeden sachlichen Grundes entbehrt."
27 FG Köln vom 22.5. 2014, 11 K 3056/11, EFG 2014 S. 1739: „Spätestens zu diesem Zeitpunkt wäre im Rahmen einer ordnungsgemäßen Schätzung zumindest eine Herabsetzung des bislang geschätzten Umsatzes ... geboten gewesen, da sich die Schätzung an denjenigen Besteuerungsgrundlagen zu orientieren hat, die die größte Wahrscheinlichkeit der Richtigkeit für sich haben ... Diese Gesamtumstände legen einen Strafcharakter der Schätzung nahe. Damit verbleibt als einziger erkennbarer Gesichtspunkt, ... dass die Verletzung der Steuererklärungspflicht sanktioniert werden ... sollte."
28 So betrugen z.B. in FG SchleswigHolstein vom 6.3.2012, 2 K 101/11, DStRE 2012 S. 1210 die von der Steuerfahndung festgestellten verkürzten Steuern zunächst 800.000 €; diese wurden im weiteren Verlauf auf 550.000 € reduziert; im Rahmen einer tatsächlichen Verständigung bot das FA dann 170.000 € an. Trotzdem kam das FG zum Ergebnis: „Selbst, wenn man unterstellt, dass durch die zunächst errechnete hohe Steuernachforderung und die Erläuterung der möglichen strafrechtlichen Folgen bei einer Steuerhinterziehung in dieser Größenordnung Druck ausgeübt wurde, führt dies nicht zur Nichtigkeit der späteren Bescheide".
„Ob das Ergebnis einer Schätzung den tatsächlichen Verhältnissen entspricht, ist regelmäßig ohne Bedeutung ... Letztlich gehen die jeder Schätzung innewohnenden Unsicherheiten zu Lasten des Steuerpflichtigen, der dem Finanzamt durch sein pflichtwidriges Verhalten Anlass zur Schätzung gegeben hat. Dagegen kann bei geringem Verschulden des Unternehmers eine Schätzung im mittleren Bereich oder auch an der unteren Grenze des Schätzungsrahmens gerechtfertigt sein."29 Diese Sätze von Achilles verdeutlichen die Einstellung der Finanzbehörden, dass der Freiraum für Schätzungen für groß gehalten wird und Ungenauigkeiten hingenommen werden müssen, ja sogar der Grad des Verschuldens des Steuerpflichtigen das Schätzungsergebnis beeinflusst. Nach den Erfahrungen des Autors ist zu befürchten, dass die Finanzbehörden und zum Teil auch die Finanzgerichte das Ziel einer jeden Schätzung, „zutreffende" Besteuerungsgrundlagen30 (und nicht: „ein angemessenes Strafmaß") zu ermitteln, aus den Augen verlieren. Die in diesem Beitrag formulierten Grundsätze sollen dazu beitragen, zu treffsicheren Schätzungen und höherer Akzeptanz zu gelangen. Die vorstehend formulierten Grundsätze bieten den Steuerpflichtigen und den Beratern ein methodisch gegliedertes Werkzeug,31 um mit Hilfe einer Strukturierung die Schätzungsvorstellungen von Prüfern umfassend würdigen und bewerten zu können und so zu einem abschließenden und fundierten Gesamturteil zu gelangen. Eine weitgehende Operationalisierung in der Zukunft ist wünschenswert, da bislang nur nominale und ordinale Skalierungen32 bei Schätzungen möglich und diese noch zu subjektiv und situationsspezifisch ausgerichtet sind. Dies ist aber allemal besser, als mit Gemeinplätzen zu argumentieren33 und sich im Ungefähren zu verlieren.
Die vorstehenden Grundsätze sollten künftig praktiziert, präzisiert und rechtlich in der AO oder durch BFH-Rechtsprechung abgesichert werden. Ob dabei die empirische Methode (Ableitung aus in der Praxis etablierten Verfahrenstechniken) oder die teleologische Methode (Ableitun g aus dem Ziel einer Schätzung) oder die auslegende Methode (Ableitung aus Normen und Verwendung von Analogien) besser geeignet ist, ist noch zu klären.
29 Achilles, Kassenprüfung in bargeldintensiven Unternehmen, 2014, S. 255. Achilles ist als Betriebsprüfer bei der FinVerw NRW tätig.
30 Nach der Legaldefinition in § 199 Abs. 1 Satz 1 AO sind Besteuerungsgrundlagen „tatsächliche und rechtliche Verhältnisse, die ... für die Bemessung der Steuer maßgebend sind". Hingegen Sind Bemessungsgrundlagen z.B. Umsätze, Gewinne, Privatentnahmen (§ 4 Abs. 1 EStG), vGA; diese sind keine „Tatsachen" und dürfen nicht geschätzt werden.
31 Nach der Erkenntnistheorie ist „Methode" ein systematisiertes Verfahren zur Gewinnung von Erkenntnissen.
32 Beispiel für nominale Skalierung: Schätzungsbefugnis ja/nein; für ordinale Skalierung: Bagatelle, kleiner Fehler, leichter Fehler, mittelschwerer Fehler, schwerer Fehler, gravierender Fehler, fundamentaler Fehler; oder für metrische Skalierung: Sicherheitszuschlag je nach Merkmalsausprägungen 0 %, 0,5 %, 1 %, 1,25 %, 1,5 % usw.
33 Gemeinplätze (... ist geeignet, ... ist vernünftig, ... ist unbedenklich, wird griffweise,... erscheinen nicht unangemessen hoch usw.) können keine substantiierte, nachvollziehbare und schlüssige Schätzungsdurchführung ersetzen.
Gesetzgeber, Finanzverwaltung und Rechtsprechung haben die Anforderungen an die Ordnungsmäßigkeit der Ermittlung und Aufzeichnung von Barbewegungen erheblich verschärft. Es werden zudem Prüfungsmethoden entwickelt, die es ermöglichen, so lange zu prüfen, bis sich eine „Vielzahl von Mängel“ oder „schwere Mängel“ finden. Danach ist das Tor für Schätzungen geöffnet. Der Beitrag beschäftigt sich mit den Konsequenzen bei einer nicht ordnungsmäßigen Kasse.
Bei inhabergeführten Betrieben im Gastronomiebereich oder im Einzelhandel scheint es keine ordnungsmäßig geführten Kassen mehr zu geben.1 Ob man als Unternehmer eine teure oder eine preiswerte Kasse bzw. eine teure oder preiswerte Software kauft, ob man EXCEL oder das nicht nachträglich veränderbare DATEV-Kassenbuch als Aufzeichnungsmedium verwendet, ob man täglich ein unterschriebenes Zählprotokoll verwendet oder nicht, geschätzt wird fast immer.2 Leichter kann die Betriebsprüfung (Bp) Mehrergebnisse nicht realisieren. Der Beitrag listet daher nicht in Form einer Checkliste von ca. 400 Punkten3 die Anforderungen und Fehlermöglichkeiten [S. 81] im Kassenwesen auf, sondern behandelt die Konsequenzen bei einer (nach Ansicht der Finanzbehörde) nicht ordnungsmäßigen Kasse.
1. Alle vom Verf. befragten Prüfer verneinten die Frage, ob sie die Kasse in einer Gaststätte einmal ohne formelle und materielle Fehler vorgefunden hätten. Dasselbe gilt für den Bereich des Vorfindens eines ‚ordnungsgemäß‘ geführten Fahrtenbuchs. Es stellt sich die Frage, was Gesetzesregelungen, Aufzeichnungsvorschriften der Verwaltung und Rechtsprechung zur Frage der „Ordnungsmäßigkeit“ nützen, wenn diese Regelungen faktisch nicht eingehalten werden (können), sei es wegen Detailverliebtheit, sei es wegen Unzumutbarkeit, sei es wegen Zeitdruck, sei es wegen Unklarheit, sei es wegen Überforderung.
2. Vgl. hierzu Achilles, Kassenführung in bargeldintensiven Unternehmen, 2014, 251: „In bargeldintensiven Betrieben, so zeigt die Praxis, enden mehr als 90% (!) der Betriebsprüfungen in der Schätzung von Besteuerungsgrundlagen“. Teutemacher, Handbuch zur Kassenführung, 2015, 2, schätzt, dass in 95% der Fälle die Kassenführung verworfen wird. Vgl. ferner Kalischke: Betriebe bangen vor Steuerprüfern - Verbände kritisieren: Kassenführung wird bei 95% der Unternehmer verworfen, WN v. 15.3.2014, 8.
3. Vgl. z.B. die Checklisten von Teutemacher, Handbuch zur Kassenführung, 2015, 165. Hier sind auf 15 eng beschriebenen Selten mit ca. 20 Positionen pro Seite 300 Fragestellungen angesprochen. Diese Checkliste erhebt keinen Anspruch auf Vollständigkeit. Vgl. ferner die umfangreiche Checkliste von Achilles, Kassenführung in bargeldintensiven Unternehmen, 2014, 260.
Häufig kommt aber als Käufer aus kartellrechtlichen, finanziellen oder sonstigen Gründen nur ein ausländischer Käufer in Frage, insbesondere wenn es um oligopolistische Strukturen geht wie bei den Unternehmen der Energieversorgung, der Mineralöl-, Zucker-, Chemie-, Automobilindustrie u.ä. Für ausländische Käufer aber ist IDW S1 unbekannt, bzw. IDW S1 wird nicht nur wegen des komplizierten und unbekannten Einbezugs der persönlichen steuerlichen Verhältnisse des Erwerbers abgelehnt. Ausländische Erwerber richten sich nach eigenen Konzern-Richtlinien oder – soweit vorhanden - nach den jeweiligen nationalen Standards oder – über Sachverständige - unmittelbar nach den International Valuation Standards (IVS).
1. Abgrenzung und Eingrenzung
Nur „soweit" - und eben nicht „wenn“ - die Finanzbehörde die Besteuerungsgrundlagen nicht ermitteln kann, hat die Finanzbehörde nach § 162 Abs. 1 Satz 1 AO eine Schätzungsbefugnis. Die durch das Tatbestandsmerkmal „soweit“ vorgegebene Einschränkung erfordert gerade bei Kassenmängeln Abgrenzungen und Eingrenzungen. Diese
Eingrnzung kann z.B. räumlicher Natur sein (z.B. nur bezogen auf die Filiale in X-Stadt, nicht aber auf alle Filialen), sie kann kundenbezogener Natur sein (z.B. nur Barverkäufe, nicht aber das Rechnungsgeschäft, oder: nur Theken-, nicht aber Restaurationsumsätze), sie kann auch zeitlicher Natur sein (z.B. nur für den Zeitraum der Verwendung einer bestimmten Kasse). Die Eingrenzung kann aber auch anderen Kriterien folgen, z.B. nach Art der Zahlungsbewegungen: Wenn die Einzahlungen der Kunden in eine Kasse lückenlos durch Z-Bons belegt und vielleicht sogar mit einem Warenwirtschaftssystem verbunden sind, müssen sich Fehler im Auszahlungsbereich der Kasse nicht zwingend auf die Einzahlungsseite auswirken.4 Oder: Wenn der Unternehmer nachweislich selbst niemals an der Kasse steht, vielmehr ein ausgefeiltes Kontrollsystem bzgl. der Mitarbeiter praktiziert, dann sind Unterstellungen bzgl. der Generierung schwarzer Einnahmen aufgrund von Kassenmängeln obsolet. Oder: Aus Mängeln in einem Jahr kann nicht zwingend geschlossen werden, dass auch in den anderen Jahren diese Mängel vorlagen. Die Schätzungsbefugnis ist für jeden Veranlagungsabschnitt und jede Steuerart gesondert zu ermitteln und durch die Finanzbehörde nachvollziehbar festzustellen. Das Gesetz geht offensichtlich von dem Regelfall einer partiellen Schätzung aus; die Praxis verwendet hingegen contra legem fast ausschließlich Totalschätzungen, wobei der Unterschied zu den bisherigen Besteuerungsgrundlagen technisch als „Sicherheitszuschlag“5 bezeichnet wird und eine partielle Schätzung vortäuscht.6 Auf eine genaue Abgrenzung und Benennung der von dem Bp vorgefundenen unbedenklichen Bereichen von den Bereichen mit Kassenmängeln sollte bestanden werden.
4. Vgl. zur Differenzierung zwischen Einnahmen- und Ausgabenseite: Brinkmann, StBp 2014, 33: „Ein Sicherheitszuschlag zu den Einnahmen ist grds. nur gerechtfertigt, wenn die festgestellten Mängel der Buchführung einen Zusammenhang mit der Einnahmenseite haben“.
5. Der Charme des Sicherheitszuschlags liegt darin, dass i.d.R. weitergehende strafrechtliche Ermittlungen entfallen, da es wegen der vorliegenden mangelnden Sicherheit an der erforderlichen strafrechtlichen Gewissheit fehlt. Der Fall liegt anders bei Zuschätzungen und Vollschätzungen.
6. Die Verwendung eines „Sicherheitszuschlages von 2%" ist eine Totalschätzung (auch als „Vollschätzung" bezeichnet), weil die Besteuerungsgrundlage (zutreffend wäre der Begriff „Bemessungsgrundlage“) auf 102% der bisherigen (falsch erklärten) Umsätze geschätzt wird. Eine Vollschätzung (anstelle einer partiellen Schätzung) kommt aber nach AEAO zu § 158 nur dann in Betracht, wenn sich die Buchführung „in wesentlichen Teilen als unbrauchbar erweist‘. Nach der Rechtsprechung ist stets zu prüfen, ob nicht doch eine Teilschätzung anhand der vorhandenen Unterlagen möglich ist, vgl. BFH v. 29.1.1992 X R 145/90, juris.
2. Feststellungslast
Durch die Bezugnahme im Gesetz auf die „Finanzbehörde“ wird die Feststellungslast, ob und inwieweit die Unmöglichkeit einer Ermittlung der Besteuerungsgrundlagen vorliegt oder nicht, der Finanzbehörde übertragen. Tatsächlich wird nicht gerade selten die Feststellungslast in der Prüfungspraxis auf den Stpfl. abgewälzt, und zwar mittels das Instituts der Mitwirkungsverpflichtung. Dies führt letztlich zu einer Umkehrung der Feststellungslast und zu einer im Gesetz nicht vorgesehenen Art der Selbstprüfung durch den Unternehmer. Die Anforderungen an die Mitwirkungspflicht des StpfI. dürfen aber nicht überzogen und der Grundsatz der Verhältnismäßigkeit und der Nachweis der Erforderlichkeit sollten stets eingefordert werden. Wenn auf das „sachliche Gewicht“ von Mängeln abzustellen ist,7 ist es zur Lösung dieses Mess- und Abwägungsproblems erforderlich, dass die Finanzbehörde aufgrund des Feststellungserfordernisses und unter Beachtung des Untersuchungsgrundsatzes gem. § 88 AO verwertbare Aussagen zu den Bereichen macht, die mängelfrei sind.
7. So der BFH im Zeitreihenurteil v. 25.3.2015 X R 20/13, BStBl. II 2015, 743 - DB 2015, 1702, ähnlich Kulosa, DB 2015, 1797. So ist es auch nicht Sache des Stpfl. „darzulegen bzw. zu dokumentieren, dass das ... Kassenprogramm Manipulationen und Änderungen nicht zulässt“. Dies obliegt dem Finanzamt, FG Rheinland-Pfalz v. 24.8.2011 2 K 1277/10, dejure.org.
Nach § 162 Abs. 1 Satz 1 AO sind „alle“ Umstände zu berücksichtigen, die für die Schätzung von Bedeutung sind. Wird nur ein „Teil“ der relevanten Umstände berücksichtigt, kann es zu einer Fehlschätzung kommen, die gesetzlich nicht gewollt ist.
Beispiel: Wenn ein Lebensmitteleinzelhändler im Jahr 1 Mio. € umsetzt und der Prüfer einen sog. „Sicherheitszuschlag“ von 10% = 100.000 € pro Jahr vornehmen will, so bleibt die Frage offen, ob der Unternehmer im Prüfungszeitraum derartige Beträge verwenden konnte oder angelegt hat.
Der Stpfl. sollte nicht damit einverstanden sein, wenn bei der Schätzung nur auf die umstrittenen „amtlichen Richtsätze“ abgestellt wird.8 Bereits in den Naturwissenschaften ist anerkannt, dass die Verwendung möglichst vieler (unterschiedlicher) Verfahren zu einer Verbesserung von Messergebnissen führt. Es ist im Schätzungsfall anzuraten, den Prüfer im Hinblick auf § 162 Abs. 1 Satz 1 AO bereits im Vorfeld auf das Vorhandensein geeigneter Schätzungsmethoden hinzuweisen. Das Ziel einer Schätzung ist nicht die Bestrafung des Stpfl. Hier gibt es andere Sanktionen (z.B. Einleitung eines Steuerstrafverfahrens). 9Es gilt der fundamentale Grundsatz ne bis in idem, wonach der Stpfl. nicht zweimal in derselben Sache bestraft werden darf, z.B. bei Verletzung formeller Kassenfehler einmal durch eine zu hohe Nachzahlung,10 ferner durch das nachfolgende [S. 82] Strafverfahren. Dieser Grundsatz hat durch die Regelung in Art. 103 Abs. 3 GG Verfassungsrang. Es sollte auch nicht akzeptiert werden, wenn sich eine Schätzung „am oberen Rand des Schätzungsermessens“ bewegt. Zielrichtung einer Schätzung muss immer die Ermittlung der nach der höchstmöglichen Wahrscheinlichkeit zutreffenden und eben nicht der höchstmöglichen Besteuerungsgrundlagen sein.
8. Die Richtsatzprüfungen der Finanzverwaltung unterliegen weder einer öffentlichen Kontrolle noch gibt es eine Mitwirkung der Unternehmer- bzw. Beraterseite. Es stellt sich die Frage, ob die Finanzbehörden Erfahrungssätze der Berater (z.B. DATEV-Betriebsvergleiche) akzeptieren. Kritisch zur Verwendung amtlicher Richtsätze z.B. BFH vom 25.3.2015 X R 20/13, BStBl. II 2015, 743. Der Begriff „amtlich" zeugt von gutem Marketing der Finanzbehörden und suggeriert Richtigkeit.
9. Sanktionen im Hinblick auf Strafe, Ordnungswidrigkeit und Zwangsgeld ergeben sich z.B. bzgl. der Verletzung der Darstellungs-, Bewertungs- und Aufstellungspflicht aus §§ 331, 334, 335 HGB. Bei einer AG kann sich als Konsequenz bei entsprechenden Verstößen die Nichtigkeit oder die Pflicht zur Sonderprüfung ergeben (§§ 256, 258 AktG).
10. Die Finanzbehörde darf nicht bewusst zu hoch schätzen, so schon RFH v. 5.6.1935 VI A 71/34, RStBI. II 1935, 898. Sie hat vielmehr stets „zutreffend“ zu schätzen, weshalb Aussagen wie „Orientierung am oberen Schätzungsrahmen wegen Verletzung der Erklärungspflicht“ (BFH vom 12.12.2013 X B 205/12, RS0768370 = BFH/NV 2014, 490 [n.v.]), oder: „der Beweisverderber oder Beweisvereiteler darf aus seinem Verhalten keinen Vorteil ziehen“ (BFH v. 15.2.1989 X R 16/86, DB 1990, 259 = NVwZ-RR 1990, 282) insoweit neben der Sache liegen.
§ 162 Abs. 2 AO nennt verschiedene Fallgruppen für eine Schätzung. Relevant ist für den Bereich des Vorliegens von Kassenmängeln Satz 2. Hiernach ist zu schätzen, wenn die Buchführung oder die Aufzeichnungen11 des Stpfl. der Besteuerung nicht nach § 158 AO zugrunde gelegt werden können, „soweit“ nach den Umständen des Einzelfalls ihre sachliche Richtigkeit zu beanstanden ist.
11 Für Überschussermittler besteht mangels gesetzlicher Grundlage weder eine Buchführungs- noch eine Kassenaufzeichnungspflicht, sondern nur eine Einnahmenaufzeichnungspflicht (§ 22 UStG). Letztere ist erfüllt, wenn die Z-Bons lückenlos vorhanden sind. Nach § 146 Abs. 5 AO können die Bücher und die sonst erforderlichen Aufzeichnungen auch in der geordneten Ablage von Belegen bestehen.
1. Formelle Mängel
„Soweit“ die sachliche Richtigkeit nicht zu beanstanden ist, ist die Kasse (als Teil der Buchführung bzw. der Aufzeichnungen) der Besteuerung zugrunde zu legen. Hier kommt es auf die Abgrenzung und die Feststellung an, was sachlich richtig ist und was nicht. Zudem kommt es nicht auf die „formelle“ Richtigkeit als begrifflichen Gegensatz zum gesetzlichen Tatbestandsmerkmal der „sachlichen“ Richtigkeit an; dies gilt selbst bei einer Vielzahl von formellen Fehlern.12 Nach der hier vertretenen Ansicht führen formelle Buchführungsmängel nicht zur sachlichen Unrichtigkeit, weshalb formelle Buchführungsmängel, auch wenn diese wesentlich sind, allein eine Schätzungsbefugnis der Behörde nicht begründen können.13 Das Gesetz knüpft nach dem klaren Wortlaut allein an die sachliche Richtigkeit an. Teilweise wird die Behauptung vertreten, dass eine Vielzahl formeller Fehler zur Schätzungsbefugnis führt.14 Man könnte eher umgekehrt formulieren, dass eine Vielzahl an sachlich richtiger Verbuchung und Aufzeichnung keinen Raum für eine Schätzung lässt.
12 A.A.: BFH v. 2.6.2006 I B 41/05, RS0759473; FG Köln v. 2.5.2007 5 K1 4125/06.
13 Der Nachweis, dass eine formell ordnungsmäßige Buchführung sachlich falsch ist, hat mit „an Sicherheit grenzender Wahrscheinlichkeit“ zu erfolgen, BFH v. 24.6.1997 VIII, R 9/96, DB 1998, 352. Bloße Möglichkeiten und Vermutungen reichen nicht. Zutreffend Achilles, Kassenführung in bargeldintensiven Unternehmen, 2014, 253: „Während formelle Fehler das materielle Ergebnis noch richtig erscheinen lassen, haben materielle Fehler auch immer Auswirkung auf die formelle Ordnungsmäßigkeit, da Geschäftsvorfälle nicht richtig oder vollständig abgebildet sind.“
14 AEAO zu § 158 AO; BFH-Urteil v. 2.12.2008 XB 69/08 m.w.N., juris.
2. Abgrenzung zu materiellen Fehlern
Im Rahmen der vorgenannten Abgrenzung ist die Unterscheidung zwischen der zutreffenden „Ermittlung“ von Einnahmen (z.B. mittels Registrierkasse) - dies würde ggf. zu Fehlern materieller Art führen - und der zutreffenden „Aufzeichnung“ von Einnahmen in einem Kassenbuch - dies würde ggf. zu Fehlern formeller Art führen - von Bedeutung. Fehler materieller Art sind Unterlassungen und Handlungen, die die Besteuerungsgrundlagen verändern, z.B. die Nichterfassung von Einnahmen und Ausgaben oder von Warenbeständen. Fehler formeller Art sind z.B. Verstöße gegen Formvorschriften, Belegnachwelspflichten, Pflichten zur zeitnahen Aufzeichnung, Veröffentlichungspflicht u.ä. Selbst bei 100 Fehlern formeller Art wird durch die Vielzahl kein Fehler materieller Art, sonst würden Begriffe nach dem final erwünschten Ergebnis verbogen.15
15 Die Tatbestandsmerkmale „sachliche Richtigkeit zu beanstanden“ in § 162 Abs. 2 AO werden von Verwaltung und Rechtsprechung extensiv ausgelegt und in einen neuen Sachzusammenhang gestellt, und zwar mit Hinweis auf die Möglichkeit bzw. Unmöglichkeit der Überprüfung; hierdurch werden aus formellen Fehlern stets materielle (sachliche) Fehler, vgl. z.B. FG Düsseldorf v. 7.8.1986 XIV 520/83: „Dadurch, dass der Kläger gesetzlich vorgeschriebene Aufzeichnungen (§ 144 AO) nicht geführt hat, wird eine materielle Überprüfung des von ihm erklärten Betriebsergebnisses unmöglich gemacht“. Bei dieser Verfahrensweise gibt es faktisch keine formellen Fehler mehr, weil jeder formelle Fehler „irgendwie“ eine Überprüfung erschwert bzw. unmöglich macht.
3. Praxisfälle Wenn der Gewinn nach § 4 Abs. 3 EStG ermittelt wird, ist ein Kassenbuch zur täglichen Feststellung des Kassenbestands nicht zu führen.16 Kasseneinnahmen „sollen“ nach dem gesetzlichen Wortlaut in § 146 Abs. 1 Satz 2 AO täglich festgehalten17 werden, gleichwohl wird diese Sollvorschrift in eine Mussvorschrift umgedeutet.18 Soweit bezüglich des Begriffs der „Einnahmen“ auf eine generelle Einzelaufzeichnungspflicht abgestellt wird, steht dies nicht im Einklang mit der Einzelhandels-Rechtsprechung des BFH, wonach es auf die Praktikabilität und Zumutbarkeit ankommt.19
16 BFH v. 16.2.2006 X B 57/05, RS0759046. Vgl. ferner den Ls. des FG des Saarlands v. 17.7.2003 1 K 174/00, EFG 2003,1437: „Bei dem in Form des ‚Kassenberichtes‘ geführten Kassenbuch müssen die Notizen über den täglichen Kassenendbestand nicht aufbewahrt werden, wenn ihnen lediglich eine Transportfunktion zukommt; es muss aber täglich der Kassenendbestand ermittelt werden. Beim fortlaufend geführten Kassenbuch muss keine tägliche Feststellung des Kassenendbestandes erfolgen; es müssen aber die Aufzeichnungen über die Tageseinnahmen aufbewahrt werden.“
17 „Festhalten“ ist begrifflich in Bezug auf Ordnung, Ablage und Protokollierung weniger als „aufzeichnen“. „Festgehalten werden“ können Einnahmen auch durch das Sammeln der Einnahmenursprungsbelege (Z-Bons). Wenn durch Kassenstreifen, Quittungen, Bons oder Bankeingänge bereits eine zeitliche Festlegung erfolgt ist, braucht dies insoweit nicht noch zusätzlich „aufgezeichnet“ werden.
18 Bei einer Mussvorschrift müsste z.B. der Aufsteller von Zigarettenautomaten täglich alle Automaten abfahren, um die Einnahmen zu erfassen, was utopisch erscheint.
19 BFH v. 26.2.2004 Xl R 25/02, DB 2004, 1349. A.A: Pump, StBp 2015, 4.
4. Gesamtbild aller Umstände
Für die formelle Ordnungsmäßigkeit der Buchführung ist das Gesamtbild aller Umstände im Einzelfall maßgebend; eine Buchführung kann trotz einzelner Mängel nach den §§ 140-148 AO aufgrund der Gesamtwertung als formell ordnungsmäßig erscheinen (Abschn. 122 AEAO zu § 158). Zur Darstellung des Gesamtbilds sind im Bp-Bericht positive wie negative Feststellungen zur Buchführung erforderlich und nicht nur - wie es häufig der Fall ist - einseitig die Darstellung der Mängel. Ferner ist die substantiierte Bewertung aller Einzelfeststellungen zur Klärung des sachlichen Gewichts20 erforderlich. [S. 83]
Die „Schätzung“ als Surrogat für die „Ermittlung der Besteuerungsgrundlagen“ kann durchaus zu einem identischen wie auch zu einem niedrigeren Ergebnis führen, z.B. wenn der Stpfl. bei einem Überschussermittler die EC-Kartenumsätze irrtümlich sowohl in der Kasse wie In der Bank einnahmenseitig erfasst hat. Eine Verpflichtung oder ein Recht zur Schätzung bei nur formellen Mängeln besteht nicht,21 bei sachlichen Mängeln hingegen nur im einzugrenzenden Bereich und nicht im gesamten Umfang.
20 In der Rechtsprechung wird weniger der Schwerpunkt auf den Gesetzeswortlaut „sachliche Richtigkeit“ als vielmehr auf andere Begriffe wie „Wesentlichkeit“ und „sachliches Gewicht“ abgestellt. Diese - nicht gesetzlichen - Begriffe stellten ein Aliud dar. „Wesentliche“ formelle Mängel und sogar eine „Vielzahl unwesentlicher Mängel“ können hiernach auch zur Schätzungsbefugnis führen, vgl. Achilles, Kassenführung in bargeldintensiven Unternehmen, 2014, 25, 253, m.w.N. Dies erscheint zweifelhaft. Es wäre vieles besser, wenn de lege ferenda Verstöße gegen formelle Buchführungs- und Aufzeichnungsanforderungen - wie teilweise im HGB - mit Ordnungswidrigkeiten statt mit Schätzungen sanktioniert würden, weil dann die Prüfungen sich auf die sachliche Richtigkeit konzentrieren würden. So ist z.B. die Auferlegung eines Verzögerungsgelds ab 2.500 € bei Verlagerung der Buchführung ins Ausland gem. § 140 Abs. 2b AO in diesem Fall der richtige Weg und nicht die Schätzung der Besteuerungsgrundlagen.
21 BFH v. 25.1.1990 IV B 140/88, Beck RS 1990, 06161. So auch deutlich FG Rheinland-Pfalz v. 24.8.2011, 2 K 1277/10, dejure.org: In einem Friseurbetrieb wurde ein EXCEL-Kassenbuch geführt, die Unveränderbarkeit der Kassenbucheintragungen war nicht gewährleistet, die Kassenstreifen waren nicht mehr vorhanden und der durchgeführte Chi-Quadrat-Test war positiv. Der Klage des Stpfl. wurde vollumfänglich stattgegeben.
Ist partiell oder vollumfänglich zu schätzen, stellt sich die Frage der Verwendung einer geeigneten Schätzungsmethode. Die Verwendung mehrerer geeigneter Schätzungsmethoden macht das Ergebnis valide. Einleuchtend ist, dass diejenigen Methoden angewandt werden sollen, die zu möglichst zutreffenden Besteuerungsgrundlagen führen. Je höher die Wahrscheinlichkeit ist, ein zutreffendes Ergebnis zu erzielen, umso mehr engt sich der Raum für alternative Schätzungsmethoden ein. Der BFH hat mit Urteil v. 25.3.2015 X R 20/13 entschieden, dass der Zeitreihenvergleich,22 sofern er überhaupt eine geeignete Schätzungsmethode darstellt, gleichwohl gegenüber anderen Methoden nachrangig ist, vielmehr hat der Prüfer nur eine Wahlfreiheit bei der Auswahl zwischen mehreren gleich geeigneten Schätzungsmethoden (explizit genannt werden: Aufschlagskalkulation, Geldverkehrsrechnung, Vermögenszuwachsrechnung).
Die Anwendung eines Sicherheitszuschlags - dieses Wort findet sich nicht im Gesetz - ist keine Schätzungsmethode und kann auch nicht für die Überprüfung von Besteuerungsgrundlagen herangezogen werden. Der Sicherheitszuschlag ist in der Prüfungspraxis eine grobe Vorgehensweise, um in möglichst wenigen Schritten (meist multiplikative Verknüpfung von griffweise geschätztem Prozentsatz und falsch erklärten Umsatz) in einer Verhandlung (z.B. anlässlich einer tatsächlichen Verständigung) zu einer Einigung zu kommen. Der Sicherheitszuschlag wäre nur dann - theoretisch - eine eigene Schätzungsmethode, wenn feststünde, dass der Stpfl. immer denselben Prozentsatz vom Umsatz verkürzt hat und dieser Prozentsatz auch bekannt ist. Hieraus erklärt sich die Attraktivität der Verwendung von Richtsätzen, die einseitig von der Finanzverwaltung in einem undurchsichtigen Verfahren „ermittelt" wurden. Das FG darf immerhin anhand der für die Vergleichsbetriebe geführten Steuerakten prüfen, ob gegen die Zahlen der Vergleichsbetriebe Bedenken bestehen; dabei ist dem Stpfl. über die Heranziehung der Vergleichsbetriebe und die Vergleichszahlen Gelegenheit zur Stellungnahme zu geben.23 Hiervon sollte stets Gebrauch gemacht werden. Vom Ranking her dürfte die Verprobung der Privatentnahmen (ähnlich: Geldverkehrsrechnung) die geeignetste Schätzungsmethode sein. Auch die Kalkulation (es gibt zahlreiche Varianten) dürfte durchweg besser sein als die griffweise Zuschätzung oder die Verwendung von Richtsätzen, die allenfalls für Zwecke einer Plausibilisierung eine Verprobungsmethode darstellt.
22 Vgl. BFH v. 25.3.2015 X R 20/13, BStBI. II 2015, 743; Vorinstanz: FG Münster v. 26.7.2012 4 K 2071/09, EFG 2012, 1982, zum Ranking vom Schätzungsmethoden: „Steht hingegen bereits aus anderen Gründen fest, dass die Buchführung nicht nur formell, sondern auch materiell unrichtig ist (z.B. “nicht gebuchte Wareneinkäufe nachweislich unversteuerte Betriebseinnahmen, rechnerische Kassenfehlbeträge usw.), und übersteigt die nachgewiesene materielle Unrichtigkeit dar Buchführung einer von den Umständen des Einzelfalls abhängige Bagatellschwelle, können die Ergebnisse eines - technisch korrekt durchgeführten - Zeitreihenvergleich auch für die Ermittlung der erforderlichen Hinzuschätzung der Höhe nach herangezogen werden, sofern sich im Einzelfall keine andere Schätzungsmethode aufdrängt, die tendenziell zu genaueren Ergebnissen führt und mit vertretbarem Aufwand einsetzbar ist. ... Hinsichtlich seiner technischen Durchführung setzt der Zeitreihenvergleich als mathematischstatistische. Methode eine besonders sorgfältige Ermittlung der Tatsachengrundlagen (Ausgangsparemeter) voraus.“ In derartigen Fällen ist „eine Plausibilitätsprüfung der Ergebnisse des Zeitreihenvergleichs vorzunehmen, die sich nicht allein und einen summarischen Vergleich mit den amtlichen Richtsätzen beschränken darf.“ Vgl. dazu auch Kulosa. DB 2015,1997.
23 Vgl. BFH v. 18.12.1984 VIII R 195/82, RS0744227.
Wichtige Entscheidungsmerkmale für eine korrekte Schätzungsdurchführung sind in positiver Hinsicht die Schlüssigkeit, Vernünftigkeit und Möglichkeit24, ferner die Überprüfbarkeit25, Sachgerechtigkelt26 sowie Verhältnismäßigkeit27 und in negativer Hinsicht der Ausschluss von Willkür28 und Realitätsferne29.
23 Vgl. BFH v. 18.12.1984 VIII R 195/82, RS0744227.
24 Anlehnung an BFH v. 18.12.l984, VIIl R 195/82, RS0744227.
25 Vgl. BFH v. 23.4.2015 V R 32/14, RS1047172.
26 Vgl. BFH v. 25.3.2015 X R 20/13, BStBl. II 2015, 743. Gleichzeitig hat in diesem Urteil der BFH entschieden, dass das Fehlen von Zählprotokollen bei offenen Ladenkassen bzw. von Tagesendsummenbons sowie - künftig - das Fehlen der Programmierprotokolle dann kein gravierender formeller Mangel darstellt, wenn das konkret verwendete Kassensystem trotz seiner Programmierbarkeit keine Manipulationsmöglichkeiten eröffnet und der Stpfl. dies darlegen kann. Dabei ist davon auszugehen, dass die über Großhandelsmärkte und Internet vertriebenen Kassen im Low-Price-Segment keine Änderung der Programmierung (wohl von Parametereinstellungen) zulassen, ganz im Gegenteil zu den meist windowsbasierten Kassensystemen.
27 Rechtsdogmatisch hat dieser Grundsatz seine Grundlage im Rechtsstatsprinzip des Art. 20 Abs. 3 GG.
28 Willkür steht für eine Rechtsanwendung ohne sachlichen Grund. Hierzu gibt es eine umfangreiche. FG- und BFH-Rechtsprechung, vgl. z.B. BFH v. 30.8.2007 II B 90/96, BecksRS 2007, 25012403. Im vorgenannten Beschluss differenziert der BFH zwischen einem „groben Schätzungsfehler“ (dieser führt zur Nichtigkeit, wenn die Finanzbehörde bewusst und willkürlich schätzt) und einem „besonders schwerwiegenden Fehler“ i.S.d. §125 AO, der lediglich offenkundig sein muss
29 Anlehnung an BFH v. 1.4.2008 X B 104/07, R50762486. Grundlegend FG Köln v. 22.5.2014 – 11 K 3056/11, open-Jur: „Spätestens zu diesem Zeitpunkt wäre im Rahmen einer ordnungsgemäßen Schätzung zumindest eine Herabsetzung des bislang geschätzten Umsatzes... geboten gewesen, da sich die Schätzung an denjenigen Besteuerungsgrundlagen zu orientieren hat, die die größte Wahrscheinlichkeit der Richtigkeit für sich haben ... Diese Gesamtumstände legen einen Strafcharakter der Schätzung nahe. Damit verbleibt als einziger erkennbarer Gesichtspunkt, … dass die Verletzung der Steuererklärungspflicht sanktioniert werden …sollte.“
1. Schlüssigkeit, Vernünftigkeit, Möglichkeit und Überprüfbarkeit
Die Schlüssigkeit einer Schätzung ist gegeben, wenn die vorn Prüfer angewandte Schätzungsmethode und die von Ihm verwendeten, als zutreffend unterstellten Schätzungsgrundlagen geeignet sind, das Schätzungsergebnis zu tragen. Die Vernünftigkeit richtet sich an den sog. gesunden Menschenverstand; so kann die Annahme nach Schwarzgeldgenerierung eines Unternehmers bei fortwährender Abwesenheit nicht vernünftig sein. Die Möglichkeit eines zutreffenden Schätzungsergebnisses kann durch Plausibilisierungen infrage gestellt werden, wenn z.B. die Schätzung bei einem Hotel steht nicht im Einklang mit der möglichen Kapazitätsauslastung. Die erforderliche Überprüfbarkeit verbietet die Bezugnahme eines Prüfers auf geheime (finanzamtsinterne) Dossiers (z.B. Erfahrungsberichte bzgl. Kassensystemen) oder die [S. 84] Verwendung von Richtsätzen. Behinderungen bei der Überprüfung, z.B. durch Zurückbehalt von verwendetem Datenmaterial, Berechnungen und Rechenformeln sowie der Abwägungsüberlegungen des Prüfers, sollten nicht gebilligt werden.
2. Sachgerechtigkeit und Verhältnismäßigkeit
„Der Begriff der Sachgerechtigkeit bezeichnet einen Handlungsmaßstab öffentlicher Verwaltungen. Sachgerechtigkeit liegt vor, wenn bei einem zu lösenden Problem die Problem- und Sachlage analysiert und bewertet wird. Die Bewertung der Problem- und Sachlage sollte hierbei präzise, richtig (d.h. dem tatsächlichen Sachverhalt entsprechend), vorurteilsfrei und vollständig vorgenommen werden. Sofern die Jeweilige Problemlage Entscheidungsspielräume eröffnet, so sind bei der Bestimmung denkbarer Entscheidungsalternativen alle relevanten Interessenlagen abzuwägen und ausgewogen zu berücksichtigen.“30 Die Anwendung des Verhältnismäßigkeitsgebots (auch: Übermaßverbot) stellt das mit Abstand wichtigste Schätzungskriterium dar. Hieraus folgt unmittelbar die Versagung einer Schätzungsbefugnis in Bagatellfällen sowie das Erfordernis der Skalierbarkeit von Prozentsätzen31 bei der „Ableitung“ der Höhe eines Sicherheitszuschlags32.
30 Burth/Gnädiger/Grieger, Lexikon des öffentlichen Haushaltes- und Finanzwirtschaft, 2012, Stichwort Sachgerechtigkeit
31 Die Anwendung eines Sicherheitszuschlags von 1 % des (falsch erklärten) Umsatzes mag vielleicht bei einem Lebensmittelladen an der Ecke verhältnismäßig sein, bei einem Lebensmittelkonzern mit über 10 Mrd. € Umsatz unverhältnismäßig. Die Anwendung von Bagatellgrenzen ist ein wichtiger Bestandteil der BFH-Rechtsprechung, wenn auch der Wortlaut einer Norm das nicht hergibt, z.B. bzgl. der Abfärbewirkung bei § 18 Abs. 3 Satz 1 EStG (vgl. BFH v.
27.8.2014 VIII R 6/12, DB 2015, 353).
32 Im Zeitreihenurteil (vgl. Kulosa, DB 2015, 1997) wird explizit auch eine Begründung der Höhe nach eingefordert. Hingegen wird in der Praxis so gut wie nie substantiiert begründet, warum ein Sicherheitszuschlag von 5,00 % und nicht von 0,5 %, 1,5 %, 2,50 %, 3,00 % oder von 3,25 % usw. zu erheben ist.
Willkür liegt vor, wenn der Prüfer seine Schätzung nach Gutdünken oder gar nach Belieben ausrichtet. Diese Vorgehensweise geht häufig mit atmosphärischen Spannungen während der Prüfung einher. Ein Indiz für willkürliche Schätzungen sind die im Zeitablauf der Prüfung sehr unterschiedlich hoch „ermittelten " Sicherheitszuschläge. So betrugen z.B. im FG-Urteil Schleswig-Holstein vom 6.3.201233 die von der Steuerfahndung festgestellten verkürzten Steuern zunächst 800.000 €; diese wurden im weiteren Verlauf auf 550.000 € reduziert; im Rahmen einer tatsächlichen Verständigung bot das FA dann 170.000 € an. Willkür liegt ferner vor, wenn die Finanzbehörde z.B. „griffweise" schätzt bzw. nach § 287 ZPO eine tatrichterliche Schätzung unter „Würdigung aller Umstände" erfolgt, obgleich geeignete Schätzungsmethoden zur Verfügung stehen. Realitätsferne liegt vor, wenn ein Zusammenhang von unterschiedlichen Sachen im Rahmen der Schätzungsdurchführung hergestellt wird, der in der Wirklichkeit nicht vorkommt, also, wenn z.B. die Richtsätze für Lebensmitteleinzelhandelsbetriebe auf Konzerne derselben Branche angewendet würden.
33 FG Schleswig-Holstein v. 6.3.2012 2 K 101/11, DStR 2012, 1210: „Selbst wenn man unterstellt, dass durch die zunächst errechnete hohe Steuernachforderung und die Erläuterung der möglichen strafrechtlichen Folgen bei einer Steuerhinterziehung in dieser Größenordnung Druck ausgeübt wurde, führt dies nicht zur Nichtigkeit der späteren Bescheide“.
1. Besteuerungs- vs. Bemessungsgrundlagen
Da in § 162 AO explizit auf die „Besteuerungsgrundlagen" Bezug genommen wird, ist evident, dass nur Tatsachen zu schätzen sind. Wenn hingegen „Bemessungsgrundlagen“ oder die Steuer selbst geschätzt werden, sollte dies nicht gebilligt werden.34 Die Besteuerungsgrundlagen im USt-Recht sind überdies andere als im Ertragsteuerrecht. Wenn bei einem Bilanzierenden (nach Maßgabe des Betriebsvermögensvergleichs gem. § 4 Abs. 1 EStG) zu schätzen ist, ist die zu thematisierende Besteuerungsgrundlage die Höhe des Betriebsvermögens bzw. der Privatentnahmen/Einlagen, nicht aber die Höhe von Einnahmen.35 Die Höhe der Privatentnahmen lässt sich auf der Basis einer Geldverkehrsrechnung mit Geldzuflüssen und -abflüssen als Bezugsgrößen schätzen. Bezüglich der USt können Bezugsgrößen für eine Schätzung sein: die Anzahl des nicht akzeptierten Stornos bzw. Schubladen-Öffnungen, die Anzahl der Kunden, die Höhe der nicht versteuerten Löhne, nicht aber die ohnehin schon vom Prüfer als falsch erkannten Umsätze.
34 Zusätzliche (umsatzsteuerpflichtige) Einnahmen können nicht mit zusätzlichen Privatentnahmen (bzw. vGA) gleichgesetzt werden. Dies gibt der Wortlaut des § 162 AO nicht her.
35 Man kann folgenden Grundsatz aufstellen: Je größer der Sachzusammenhang (Konnexität) zwischen der Bezugsgröße der Schätzung (z.B. Vereinnahmung von Kasseneinnahmen i.H.v. x € in der Filiale y im Zeitraum z) und der Besteuerungsgrundlage ist, um so valider ist das Schätzungsergebnis.
2. Zuschätzungsprozentsätze
Genannt werden in gerichtlichen Entscheidungen Prozentsätze von 2% bis40% der bislang versteuerten Umsätze, und zwar einheitlich in Bezug auf Sicherheitszuschläge für Umsatz und Gewinn.36 Nach den Erfahrungen des Verf. liegen die Prozentsätze in der beruflichen Praxis eher bei 0,5 % bis 1 %. Da es gerade hier zu Einigungen gekommen ist, werden derart niedrige - bzw. realistischere - Prozentsätze nicht finanzgerichtlich überprüft mit dem Ergebnis, dass ein verzerrtes Bild bei einem Vergleich mit Prozentsätzen aus gerichtlichen Entscheidungen entsteht. Warum es bei Prüfungen zwingend zu einer einheitlichen Zuschätzung bei Ertragsteuer und USt kommen muss, ist nicht erklärlich.
36 2 %: FG Düsseldorf v. 12.5.2010 XIV 520/83, openJur: „Die vom Beklagten zugeschätzten Beträge i.H.v. 2 % des Umsatzes erscheinen nicht unangemessen hoch“; 3,25 %: FG Münster v. 30.6.2005 12 V 1479/05, juris („Der Sicherheitszuschlag ... ist ebenfalls nicht zu beanstanden. Er entspricht 3,25 % des erklärten Umsatzes und ist angesichts der Mängel der Kassenführung angemessen“); 20 %: FG Düsseldorf v. 28.7.2009 15 K 829/06, juris (Das Gericht „setzt mangels anderer Anhaltspunkte griffweise … einen Sicherheitszuschlag von 20 % des jew. erklärten Jahresumsatzes an“); 40 %: FG Düsseldorf v. 28.3.2008 11 V 110/08, Haufe-Index 2079117 („Insgesamt wurde die Hinzuschätzung auf eine Höchstgrenze von 40 % der erklärten Umsätze beschränkt … Die Schätzung ist insgesamt schlüssig und nachvollziehbar“). Die Höhe der Prozentsätze ist ebenso willkürlich wie die Bezugnahme auf die Höhe der bisher erklärten Umsätze, die ja gerade falsch sein sollten. Die multiplikative Verknüpfung eines Prozentsatzes mit einer falschen Bezugsgröße ergibt denknotwendig keine zutreffende Ergebnisgröße. Der Regel-USt-Satz beträgt derzeit 19 % und eben nicht 2 % „bis“ 20 %. Es stellt sich hier die Frage der Gesetzmäßigkeit und Tatbestandsmäßigkeit der Besteuerung. Hierzu Tipke/Kruse, Rd. 25 zu § 3 AO: „Tatbestandsmäßigkeit besagt, dass Steuern nur erhoben werden dürfen, wenn der Tatbestand verwirklicht ist, an den das Gesetz die Steuerpflicht knüpft“. Eine griffweise Besteuerung, insb. für bestimmte Branchen, ist hiernach rechtswidrig.
3. Sonstige Bezugnahmen
Andere Bezugnahmen für die Bemessung der Höhe von Zuschätzungen sind die „Schwere der Mängel“ sowie die „Vielzahl der Mängel“. Selbst die „Anzahl der Beanstandungen“ kommt als Bezugsgrundlage in der Praxis vor. Da es [S. 85] sich hier um unbestimmte Rechtsbegriffe handelt, wären diese Begriffe auszulegen. Dies ist bislang unterblieben, sodass eine Operationalisierung nicht möglich Ist. Da sich zudem eine gesetzliche Grundlage nicht finden lässt, sollte man die Bezugnahme auf diese Bezugsgrößen unterlassen. Und überdies: Ist das Vorfinden von zehn Fehlern bei 400 möglichen formellen und Privatentnahmen37 pro Jahr „viel“ oder „wenig“? Ist des Unterbleibens der Inventur bei einer Gaststätte mit einem geschätzten Warenbestand zwischen 2.000 € und 3.000 € ein „schwerer“ oder ein „leichter“ materieller Mangel und vermag dieser Mangel zu einem Sicherheitszuschlag von 40.000 €. pro Jahr führen oder wäre nur der Warenbestand an den zu schätzenden „wahren Wert“ anzupassen? Bisweilen werden in der Praxis auch andere Bezugsgrößen für die Zuschätzung genommen. Beliebt und durchaus naheliegend ist z.B. die Bezugnahme auf den Betrag, den der Unternehmer (gerade noch) zahlen kann, sodass dann retrograd gerechnet wird. Der Sachzusammenhang geht dann zwar völlig verloren, andererseits kann Schlimmeres wie Insolvenz und Sozialhilfe verhütet werden.38 Andere Bezugsgrößen sind die Annahme einer bestimmten Auslastung (z.B. bei einem Hotel) oder im Rahmen einer Nachkalkulation die Höhe des Wareneinsatzes nach Maßgabe eines internen Betriebsvergleichs. Der BFH nennt als weitere Bezugsgröße die „Höhe der nicht erklärten Erlöse“, was erstaunt, weil diese ja gerade nicht bekannt ist.39
37 Nach Ansicht des Verf. handelt es sich überhaupt nicht um einen Mangel. Die Verpflichtung, den Vermerk im Kassenbuch bezüglich „Privatentnahme“ nebst Angabe von Betrag und Datum noch einmal auf einem Zettel zu wiederholen, ist Unternehmern nicht vermittelbar und stürzt die Vorurteile bzgl. behördlicher Bürokratie.
38 Viele GmbHs geraten nach umfangreichen Prüfungseinstellungen in Insolvenz, gl.A. Brinkmann StBp 2014, 69.
39 BFH v. 26.10.1994 X R 114/92, BFH/NV 1995,373. Wäre die Höhe der nicht erklärten Erlöse bekannt, bedürfte es denknotwendig keiner Schätzung.
1. Erhöhung der Einigungsbereitschaft
Mit Schätzungsumfeld ist die Gesamtheit aller rechtlichen und sozialen Verhältnisse bei einer Schätzungsdurchführung gemeint. Der durch das Schweigen des Gesetzgebers nach genauen Maßstäben für Schätzungen40 sich ergebende Freiraum wird durch die Akteure (Prüfer, FA., FG, StpfL, StB) genutzt, ohne dass System, Konsistenz und Einvernehmen bzgl. der begrifflichen und fachlichen Grundlagen erkennbar sind. Ein jeder legt den Schwerpunkt anders. Je gröber argumentiert wird, umso weniger ist man angreifbar. Da in diesem Freiraum jeder Akteur seine Ansicht durchsetzen will, nimmt es nicht Wunder, wenn in der praktischen Umsetzung anlässlich von Schlussbesprechungen und anderen Verhandlungen die sachliche Ebene in aller Stille verlassen und sanktionslos die Argumentationsbasis um nichtsachliche Einflussfaktoren erweitert wird. Dies wird zwar nicht explizit angekündigt und erst recht nicht zugegeben, sondern vielmehr mit einer Scheinsachlichkeit unter Hinweis auf gesetzliche Grundlagen und Verwaltungsanweisungen versehen. Eigenartig mutet zudem an, dass Verprobungen in Bp im Hinblick auf die Vielzahl der eingehenden Parameter immer zu Abweichungen größer als 10% führen, was damit erklärt werden kann, dass Abweichungen unter 10% der erklärten Umsätze im Unschärfebereich liegen und damit eine Schätzung nicht zulässig ist.41 Die Einigungsbereitschaft wird z.B. durch die Thematisierung erhöht, dass die Prüfungsfelder erweitert bzw. noch zahlreiche Fragen (natürlich schriftlich) geklärt werden müssen, womit die Verlängerung der Prüfungsdauer einhergeht. Ein recht häufiges Instrument ist der Hinweis, man müsse „u.U.“ prüfen, ob ein Strafverfahren einzuleiten und/oder ob der Prüfungszeitraum zu erweitern ist. Wenn plötzlich die Hinzuziehung der Steuerfahndung, des Zolls usw. im Raume steht, ist der Stpfl. ziemlich wehrlos, da die Gerichte Durchsuchungen durch Finanzbehörden wie am Fließband anzuordnen pflegen und spätere Einwendungen - was die Finanzbehörde weiß - nichts bringen.
40 Gesetzgeberisch wäre zumindest die Angebe eines Messniveaus und von skalierten Konsequenzen erforderlich.
41 BFH v. 26.4.1983 VIII R 38/82, RS0744059.
2. Sonstige Berührungspunkte mit der Finanzverwaltung
Es empfiehlt sich, sensibel zu reagieren, wenn versucht wird, den Stpfl. und den StB auseinander zu dividieren („man könne sich ja sofort einigen, wenn der StB X nicht mitwirken würde“) oder wenn AdV nicht gewährt wurde, wohl aber hinter dem Rücken des StB dem Stpfl. eine solche zugesagt wird, wenn er in der Sache den (geminderten) Betrag akzeptieren würde. Abzuraten ist davon, den Stpfl. alleine den Fragen und einer entsprechenden Argumentation der Finanzbehörde auszusetzen (Beispiel): Bei einem FA sollte der Stpfl. der Sachbearbeiterin der Rechtsbehelfsstelle nur „Belege übergeben“, was diese aber gleich ausnutzte, um unter vier Augen eine schriftliche Bescheinigung des Mandanten zu den Besteuerungsgrundlagen und zur Strafbarkeit einzuholen. Oder: Ein Prüfer ruft unmittelbar die Inhaberin eines Lebensmittel-Minimarkts an, er wolle sich einmal „ganz kurz“ den Betrieb, insb. den Warenbestand ansehen – „bitte keine Panik“. Tatsächlich erscheint er dann in Abwesenheit des StB mit zwei weiteren Prüfern, liest eine Stunde lang die Kasse aus und stellt in einem dreiständigen Gespräch u. a. intensive Fragen zu den Lebenshaltungskosten der vierköpfigen Familie. Nichtsachliche Einflussfaktoren sind nicht immer direkt erkennbar. So freut sich mancher Stpfl., dass „nur“ eine USt-Sonderprüfung angeordnet wurde, und zwar „nur“ für zwei Monate. Wenn dann z.B. der Prüfer bei einem Lebensmittelgeschäft einen Sicherheitszuschlag von monatlich „nur“ 3.000 € In den Raum stellt, dann erfährt der nachfragende Stpfl., dass die Nachzahlung weniger als 500 € beträgt. Wenn aber später der Veranlagungsbezirk oder die nachfolgende Bp den in der Schlussbesprechung akzeptierten Sicherheitszuschlag auf mehrere Jahre und auf die ESt und GewSt ausdehnt, ergeben sich Nachzahlungsbeträge im höheren fünfstelligen Bereich mit Insolvenzgefahr.
3. Abwehrmaßnahmen / Verteidigungsstrategien
Werden nicht-sachliche Einflussfaktoren der Finanzbehörde identifiziert, besteht die beste Abwehrmaßnahme darin, die Gegenseite zu einer offenen Gesprächsführung hierüber zu bewegen. Dies wird nicht immer etwas nutzen, vielmehr könnte es dann zu einer noch pedantischeren Einstellung der Verwaltung führen. In diesem Fall besteht eine gute Verteidigungsstrategie darin, selbst eine genaue Überprüfung der Ordnungsmäßigkeit der Schätzungsdurchführung [S. 86] vorzunehmen. Hier bietet es sich an, an die neu aufgestellten Grundsätze bezüglich der Anforderungen an eine Schätzung durch den BFH42 anzuknüpfen, der gefordert hat, dass die Finanzbehörde „von Amts wegen“ zumindest eine Sensitivitätsanalyse vorzunehmen hat. Da bei jeder Schätzungsmethode und erst recht bei jeder Verprobungsmethode (amtliche Richtsätze, Zeitreihenvergleich) Unsicherheiten und eine Vielzahl von Parametern in das Prüferrechenwerk eingehen, ferner die Abgrenzungen und die Gewichtung der festgestellten „Tatsachen“ nachvollziehbar sein sollten und ggf. eingehend überprüft werden können, sollte über diesen Weg zur Sachlichkeit zurückgefunden werden können und ein eigenes Urteil über die Validität der vorgenommenen Schätzung gefunden werden.
42 BFH v. 25.3.2015 X R 20/13, BStBI. Il 2015, 743: „Sollten die vorstehenden Anforderungen im Einzelfall nicht beachtet werden können, ist zumindest eine Vergleichsrechnung (Sensitivitätsanalyse) anzustellen. Diese muss verdeutlichen, welche Auswirkungen die nicht behebbaren Unsicherheiten bei einzelnen Parametern - vor allem solche Unsicherheiten, die darauf beruhen, dass der Zeitreihenvergleich auf einem Vergleich der wöchentlichen Wareneinsätze beruht, zu deren exakter Ermittlung der Steuerpflichtige aber von Gesetzes wegen nicht verpflichtet ist - auf die Ergebnisse des Zeitreihenvergleichs haben können. Eine solche Sensitivitätsanalyse gehört dann, wenn sie durch vorhandene Unsicherheiten geboten ist, bereits zu den formellen Anforderungen, die an die technisch korrekte Durchführung des Zeitreihenvergleichs zu stellen sind. Sie ist daher vom FA von Amts wegen durchzuführen und vorzulegen, damit der Steuerpflichtige, sein Berater, das FG, aber auch das FA selbst den Umfang der im Einzelfall möglichen Fehlermarge einschätzen können.“
4. Ordnungsmäßigkeit eines Kassensystems
Durch immer detailliertere, umfangreichere und zeitdichtere Regelungen der Finanzverwaltung, z.B. in BMF-Schreiben43 und Richtlinien, bzgl. der Anforderungen an die Ordnungsmäßigkeit eines Kassensystems44, der Belegaufbewahrung und Datenspeicherung sowie des Verzichts auf Skalierbarkeit und des verfassungsmäßigen Verhältnismäßigkeitsgebots wird ein Überforderungspotenzial gerade für die kleinen und mittleren bargeldintensiven Unternehmen geschaffen, so dass (fast) Immer die Schätzungsvoraussetzungen gegeben sind und diese Unternehmen dann der „Willkür“ der Finanzbehörde ausgeliefert sind. Obgleich die Grundsätze ordnungsmäßiger Buchführung zunächst vom handelsrechtlichen Kaufmannsbrauch und der Gewohnheit abgeleitet und danach durch die Verkehrsanschauung ersetzt wurden, gelten nunmehr die durch die Finanzverwaltung und durch die finanzgerichtliche Rechtsprechung gesetzten Regelungen, die im Wesentlichen auf die Überprüfbarkeit für steuerliche Zwecke und weniger auf die Ordnungsmäßigkeit betrieblicher Abläufe abstellen. Der BFH hat faktisch die Auslegungshoheit über die GoB, GDPdU, GoS, GoBS, GoDB und demnächst GoBIT45 erlangt. Der bereits beschriebene Freiraum wird aus Sicht der Finanzbehörden gut ausgefüllt, wenn zahlreiche finanzgerichtliche Entscheidungen in ihrem Sinn ergehen (z.B. mit möglichst hohen Prozentsätzen für Sicherheitszuschläge oder mit besonders hohen Anforderungen an die Kassenführung). Es nimmt daher nicht Wunder, dass vorrangig Entscheidungen veröffentlicht werden, bei denen drastische Konsequenzen45 zu verzeichnen waren. Auch erstaunt, dass viele Fälle mit Kassenmängeln schwerpunktmäßig bei bestimmten FG konzentriert sind. Die Vielzahl der geringen Zuschätzungen infolge Einigung gelangt hingegen nicht zur Veröffentlichung, was letztlich zu einem Zerrbild führt.
43 Vgl. hierzu BMF v. 1.2.1984, BStBI. I 1984, 155; v. 9.1.1996, DB 1996, 455; v. 5.4.2004, DB 2004, 1017; v.
26.11.2010, DB 2010, 2701; v.5.5.2015, DB 2015,1134.
44 Vgl. zuletzt FinMin NRW, PM v. 19.11.2015, DB 1166628.
45 Vgl. http://wvw.awv-net.de/cms/indexb-267-848.html. Erklärtes Ziel der AWV sei es, die „Dominanz der steuerrechtlichen Interpretationshoheit zu vermelden“.
46 Eine vielfach von Prüfern einseitig propagierte Faustformel besagt daher, dass nach der Rechtsprechung bei Kassenmängeln ein Sicherheitszuschlag von 1 % - 10 % des Umsatzes „unbedenklich“ sei.
Die Betrachtungen bei der Herleitung von Kassenmängeln sind im Zeitablauf immer filigraner geworden. Hingegen wird die Technik für die Bemessung der Höhe von Zuschätzungen, die durchaus häufig die Höhe des Eigenkapitels und häufig das Vermögen des Unternehmers / Haftungsschuldners übersteigen, eher gröber und wird vielfach von der Rechtsprechung erstaunlicherweise gestützt. Gerade bei den FG muss mehr Augenmaß und eine gegenüber der Bp kritische Grundhaltung eingefordert werdn.47 Als Begründung wird meist mit der Vokabel „unbedenklich“ bzw. angemessen“ unter Verzicht auf nähere Substantiierung gearbeitet. In allen Entscheidungen fehlen innere Begründungen für die Bemessung der Höhe von Sicherheitszuschlägen.
Drohen anlässlich einer Bp aufgrund von Mängeln im Kassenbereich Schätzungen, so empfiehlt es sich, nicht nur das Vorhandensein und die Schwere von Kassenmängeln in Zweifel zu ziehen, sondern den Fokus verstärkt auf die Geeignetheit der vom Bp verwendeten Methode(n), sowie auf die Güte (Validität) und Zielrichtung der Schätzung (Erlangung zutreffender Besteuerungsgrundlagen) zu richten. Der Steuerpflichtige sollte sich bewusstmachen, dass ein Rollentausch stattfindet. Diesmal ist er nicht der Geprüfte, sondern der Prüfende. Dabei können durchaus bei der Überprüfung der Schätzung ähnliche Maßstäbe angelegt werden, wie umgekehrt der Bp bei seiner Beurteilung der Kasse und der Buchführung selbst angelegt hat. Dies gilt umso, als der BFH in dem Zeitreihenurteil den Weg gezeigt hat48 (Anlegen „mindestens“ einer Vergleichsrechnung, Sensitivitätsanalyse, Möglichkeit der Schlüssigkeitsprüfung des zahlenmäßigen Ergebnisses der Schätzung, Offenlegung der Kalkulationsgrundlagen, Vorlage des vollständigen Zahlenwerks, Darlegung aller vom Prüfer vorgenommenen Wertungen, Erfüllung der erhöhten Darlegungspflicht des BP im Hinblick auf die ungleiche Informationsverteilung und ungleichem Wissensstand, besonders sorgfältige Ermittlung der Tatsachengrundlagen, Beachtung des Grundsatzes der Verhältnismäßigkeit, Nachweis des Bemühens um Aufklärung ungewisser Tatsachen vor einer Schätzung, Darlegung der Wahrscheinlichkeitsüberlegungen des Bp, Überprüfung des Auswahlermessens bei den Schätzungsmethoden mit dem Ziel, der Wirklichkeit möglichst nahe zu kommen, Überprüfungsverpflichtung eines Schätzungsergebnisses im Hinblick auf Plausibilität, Vorhandensein einer inneren Konsistenz des Zahlenwerks des Prüfers, usw.). Weist hiernach die Schätzungsdurchführung des Bp schwere Mängel auf, so kommt nach der hier vertretenen Auffassung nicht eine Korrektur der Schätzung, sondern nur die Verwerfung der Schätzung insgesamt in Betracht.
Der vorstehende Beitrag bietet ein zusammenhängendes Raster, wie man „systematisch“ [S. 87] den Schätzungen der Finanzbehörden und der Finanzgerichte argumentativ begegnen kann. Die Ansatzpunkte zur Abwehr bzw. zur Reduzierung beziehen sieh auf Schätzungsbefugnis, Schätzungsziel, Schätzungsanlass, Schätzungsmethode, Schätzungskriterien, Schätzungsgrundlage und Schätzungsumfeld und sind damit vielfältiger, als man auf den ersten Blick erkennt. Im Ergebnis sind alle Aspekte auf die Erhöhung der Begründungskraft und auf den alleinigen Anspruch auszurichten, Besteuerungsgrundlagen mit der größten Wahrscheinlichkeit der Richtigkeit anzusetzen (Vorrangstellung der Treffsicherheit). Zusätzlich empfiehlt sich das häufigere Anrufen der Gerichte, das Richten von Petitionen an die Landtage und den Bundestag im Hinblick auf das Fehlen klarer Schätzungsmaßstäbe sowie das frühzeitige Ausscheren aus dem Markt (es gibt immer noch naive und unbedarfte Personen sowie Unternehmer mit Spieltrieb, die das finanzielle Abenteuer im Gastronomie- und Einzelhandelsbereich wagen). Mancher Geschäftsführer einer GmbH wäre bei bargeldintensiven Betrieben gut beraten, diese Funktion aufzugeben und, wenn sich keine andere Person für die Geschäftsführung findet, das Unternehmen zu liquidieren.
47 Vgl. Kulosa DB 2015, 1797: „Bp-Berichte … weisen … mitunter eine höhere Qualität auf als manches FG-Urteil“.
48 Vgl. BFH-Urteil v. 25.3.2015 X R 20/13, BStBI. II 2015, 743.