執筆者: EVAN ARMSTRONG編集者: Cointime.com QD
台帳を使ってみる
会計士は長い間人工知能を使用してきましたが、それは人工知能にどのようなテクノロジー名を付けるかによって決まります。大手会計事務所は、リスクを分類するために機械学習モデルを使用することがあります。ただし、GPT-4 や Claude などの大規模言語モデル (LLM) はまだ比較的新しいため、これらの手法は監査人や会計士のワークフローにまだ広く統合されていません。
私が「会計士をターミネーター ロボットに置き換えたい」と言うとき、LLM を使用して会計士が通常行う作業を自動化する方法を探しています。
私のスカイネットの旅は単純なことから始まりました。
私は、ある期間のすべての借方とローンをリストしたスプレッドシートであるすべての会社の元帳を ChatGPT にアップロードしました。私の目標は、監査法人が行うような一連のテストを実行することです。奇妙な取引を探したり、ビジネスの健全性をチェックしたりするなどです。これらのテストは抽象的ですが、ビジネスの健全性の全体像を与える小さな分析です。
CSV ファイルがアップロードされると、システムが動作を開始します。この CSV ファイルが台帳であることを認識しているため、自身で読み取ることができる 5 つのコード ブロックを書き込みます。
注: 銀行口座情報を公開したくなかったので、画像サイズを少し工夫しました。写真はすべて補足的なものであり、この記事を読む必要はありません。
データが分類され、10 秒ほどで質問できる状態になりました。対照的に、会計士は通常、電子メールを受信するまでに 24 時間かかります。
次に、監査人が行うようないくつかの小さなテストを AI に実行させます。まず、週ごとのボリュームを示すグラフを作成してもらいます。監査人はこの分析を単純なリスク テストとして実行します。異常に取引量が多い週がある場合は、さらに確認する必要があります。
約 10 秒で、財務専門家がピボット テーブルやグラフ作成ツールを使用してグラフを描くよりも速く、グラフを作成できました。
約 10 秒で、財務専門家がピボット テーブルやグラフ作成ツールを使用してグラフを描くよりも速く、グラフを作成できました。
クールではありますが、驚くべきものではありません。さらに一歩進んでみましょう。
次に、その知識をテストすることにしました。監査人/会計士の役割は、ビジネスがどの程度安全であるかを判断することです。これを行うために、企業は通常、企業が予期せぬ請求にどれだけ早く対応できるかを測定する酸性試験比率などの評価を使用します。重要なのは、台帳を使用してこの比率を測定することはできないということです。台帳では請求書の支払いに必要な資産の流動性を知ることができないため、貸借対照表が必要になります。ありがたいことに、AI はポップクイズに見事に合格しました。
このテストは元帳では実行できず、貸借対照表が必要であることがわかります。このテストを行う場合、私は式の少し異なるバージョンを使用する傾向がありますが、それでも重要なことは正しく理解されています。 (投資家の皆様、パニックにならないでください。私はこの計算式を自分で実行しただけであり、まだ破産していません)。
次に、台帳に対して AI ができること、つまりデータの品質チェックを試してみます。普通の人間のように話しかけてみました。「データはどうですか?」と尋ねると、データをテストするための 5 つの異なる方法が示されました。プライバシー上の理由から、最初の 4 つは表示できません。それでも、分析はいずれの場合も正しいです。気になる人のために付け加えておきますが、私たちは監査人が AI で自動化するタスクをすでに 6 件ほど実行しましたが、実験で最初の明らかな間違いが見つかったのは最後のデータ テストのときでした。その結果、「平均値から標準偏差が 3 を超える」外れ値が 13 個見つかりました。
13の理由を列挙してみました。実際には外れ値はありません。それらはすべて、システムが経費とみなす列または行の合計です。つまり、AI はフォーマットによって妨げられるのです。
システムが台無しになったのは、データが原因ではなく、データのラベル付け方法が混乱したためです。これは世界で最も賢いと同時に最も愚かなインターンです。目を離さないようにしなければなりません。スプレッドシートを作成するとき、グリッド線を削除したり、重要な数値を太字にしたりするなど、読みやすくするための処理を行うことがよくあります。これが製品で発生する場合、ドキュメントはより機械可読である必要があります。驚くべきことに、データが明らかに AI を対象としたものではなかったにもかかわらず、システムはこれを実行できました。
AI に間違いを知らせて謝罪し、一緒にシートを直接編集して再アップロードすることで修正しました。
それから、まためちゃくちゃにしてしまいました。同じチャットで損益をアップロードし、取引レベルのデータと月次集計パフォーマンスを比較することで調整するよう ChatGPT に依頼しました。
バラバラになるもの
良いニュース: AI は複数のファイルを同時に分析できます。台帳の毎月の支出と損益計算書をうまく比較することができました。悪いニュース: 結果は間違っています。
またフォーマットエラーが発生してしまいました。スプレッドシートだけでは、AI が書式を理解するのは困難です。書式スタイルが大きく異なる 2 つのスプレッドシートを追加すると、システムが破損します。ファイルを読み取れるものに再フォーマットしようとしましたが、エラーが積み重なり始めました。ハッカーとの話し合いによると、これは行のヘッダーと列のヘッダーに関係があると思いますが、これにはさらなる実験が必要です。コード インタープリターは 1 つのファイルの分析を簡単に行うことができますが、チェックするファイルが増えると分析が難しくなります。
私は今でも、冒頭で述べたことを支持しています。人工知能は一部の知識労働者に取って代わることができると考えています。これらは簡単に解決できる問題です。総勘定元帳と損益計算書を同じ形式になるように再設計し、Stripe API を使用してデータベースにロードすると、完全に自動化された会計士のメリットが得られます。
次に、コード インタープリターを使用して、キャッシュ フローの割引など、これらすべてに基づいた財務分析を行うこともできます。これで、自動化された財務部門が完成します。すべてをやってくれるわけではありませんが、作業の 90% はやってくれます。そして、残りの 10% の仕事は、財務アナリストというよりもデータ エンジニアの仕事に似ています。
率直に言って、これは 500 億ドルのチャンスです。この製品を導入した企業は、会計および財務分野で有力なツールとなる機会を得ることができます。 QuickBooks や Oracle を上回る可能性があります。誰かがそれをやるべきです - テクノロジーはここにあります。
重要な問題は、OpenAI がコード インタプリタをどのように公開するかです。 ChatGPT の単なるプラグインであれば、スタートアップは気にしないでしょう。しかし、企業がアプリケーション プログラミング インターフェイス (API) を通じてそれを公開すると、実際に混乱が生じる可能性があります。スタートアップ企業は、販売データのパイプラインとフォーマットに関して多くの作業を行うことができます。マルチプレイヤーやシングル サインオンなどの機能を追加するだけで、スタートアップの存在を正当化できます。私は自分の人生を嫌いではないので、B2B ソフトウェアを販売しているわけではないので、このアイデアを自由に使ってください (コンサルタントの小切手を送ってください)。
これは素晴らしい実験ですが、もっと大きな意味があると思います。
たぶん未来はあなたが思っているよりも奇妙です
AI を構築する際の大きな課題の 1 つは、利益プールがどのように蓄積されるかを理解することです。
この実験を行うまで、私は主に既存企業が既存のワークフローや独自のデータセットに AI 機能を追加することで価値が生まれると常々信じていました。これまでの事実がそれを証明しています。 Microsoft は大規模な AI 分野で明確なリーダーであり、その勢いが衰える気配はありません。
ただし、この総勘定元帳の演習は単なる会計処理をはるかに超えたものです。それは、人工知能が生産性の世界全体をどのように破壊するかについて私の目を開かせました。 AI には、作業プロセスを根本的に再定義する可能性があるため、既存企業はこの新しい未来に移行できません。スタートアップには巨人に追いつくチャンスが本当にある。
冗談めかして、「私は馬鹿で、テクノロジーを理解していません。そして、生計のために論文を書いているのです。」と言いました。それでも、監査人の作業のほとんどを自動化することができました。才能あるチームがそれを製品化したらどうなるでしょうか?
冗談めかして、「私は馬鹿で、テクノロジーを理解していません。そして、生計のために論文を書いているのです。」と言いました。それでも、監査人の作業のほとんどを自動化することができました。才能あるチームがそれを製品化したらどうなるでしょうか?
すべての生産性向上のための作業は、データを取り込んで出力に変換することです。コード インタープリターは、入力が散文から生データに変更されたため、以前の AI システムに比べて大幅に改善されました。このツールは、心そのものを覆う抽象化レイヤーです。それは推論ツール、思考ツールであり、金融ツールではありません。リリースの発表では、OpenAI は金融ユースケースについてさえ言及していませんでした。私たちには仕事を再発明する機会がたくさんあります。コード インタープリターを使用すると、高レベルの API やデータベースにアクセスする必要さえありません。 OpenAI がそれを使用することに決めた場合、必要なのはコマンド バーとファイルだけです。
過去 1 年間、私は人工知能が労働を再構成するというアイデアを何度も聞いてきました。しかし、このツールを通じてそれが実装されているのを初めて見ました。欠陥や問題がないわけではありませんが、それは近づいています。ワクワク、怖い、爽快、素晴らしい、怖い、まだ半年も経っていないアルファ版の製品です。次のバージョンのモデルはどうなるでしょうか?あるいは、他社はどのような製品を発売するのでしょうか?
これは遠い先の問題ではなく、18 か月以内に直面する問題です。
OpenAI の最大の競争相手である Anthropic は、過去 6 か月で最も注目されたニュース記事の 1 つとして目論見書をリークしました。ある報告書によると、同社はGPT-4の10倍強力な「Claude-Next」の構築に10億ドルを望んでいるという。私は複数の情報源から、このスキームの他のバージョンが GPT-4 よりも 50 倍向上していると主張していることを確認しました。
その考えを続けて、定着させて発芽させてください。コードインタープリターよりも 50 倍賢いシステムは知識労働にとって何を意味しますか? OpenAI も同様のスケーリング機能について議論していると聞きました。
この会社がそれをやり遂げることができるかどうかは誰にもわかりませんが、2 年後には現在よりも 50 倍優れたモデルが登場すると想像できますか?確かに、これらは看板の主張であり、まったく信頼できませんが、もしそれが真実だった場合はどうなるでしょうか?たとえ空気が抜けた 10 倍改善モデルであっても、想像を絶する可能性の世界が開かれます。
これは知識労働の完全な再発明を意味します。これは、スタートアップ企業が巨人に勝つチャンスがあることを意味します。 Anthropic は宣伝資料で次のように述べています。「これらのモデルは、経済の大部分を自動化し始める可能性があります。
この実験は私に未来を垣間見せてくれました。準備ができていることを願っています。
全てのコメント