文字数ダイエット|朝日新聞社が開発した長文要約生成APIを試してみたらこうなった
目次
文章をAIが要約してくれる
朝日新聞社が指定した字数や割合に長文を要約する「長文要約生成API」を開発したとのこと。
商用利用はできませんが、評価用途であれば無償で利用できるとのことなので、早速使って評価をしてみました。
利用可能な5つの機能
このAPIは、過去30年分の記事データを、ディープラーニングの機構を用いて学習させることで、入力したデータを適宜目数を減らし要約できるとのことです。
要約に仕方については、
- 指定した長さごとに生成型要約
- すべての文の長さを揃える
- すべての文を圧縮する
- 重要な文を抽出する
- 重要な文を抽出後圧縮して、指定した長さにする
の5つを選択ができます。
元の文章は1651字
現在、要約が可能なのは100字以上2,000字以下だそう。
とりあえず、某社用に書いた下記の原稿を要約してみることにします。
皆さんこんにちは、税理士の吉澤大と申します。
今日は、「税務調査でやってはいけない3つのこと」という話をしようと思います。
税務調査が大好きだという人はまずいないでしょう。
普段は豪放磊落でならした社長が「税務調査が来るまでの一週間、ご飯がまともに喉を通らなかった」などということもあるようです。
しかし、きちんと申告をしているのであればそれほど恐れるものでもありません。
落ち着いて必要資料の提示をして、質問に素直に回答をする。
その質問への解答もなぜか面接試験のようにその場で的確に回答しなくてはいけないかのように思っている方もいるようですが、「あとで調べて回答します」という対応で何も問題はありません。
その上で処理に誤りがあれば修正をすればよいだけのことです。
ですが、税務申告ないし税務調査の対応について、これだけはやってはいけないということがあります。
1つ目は、売上の除外です。
もらった売上金を会社ではなく個人の通帳などに入れて、収益に計上すべき売上高を計上しないということです。
継続的な取引をする大口の得意先の売上を除外する人などまずいません。
実は、よく見られるのは、工場であれば作業クズや廃材を引取業者に売却した代金や自動販売機の売上などです。
それらの売上金を現金でもらったり個人の通帳に入金をさせてしまうのです。
そのため、税務署もまずは、それらの相手先からちゃんと販売データを収集した上で調査にのぞむことも多いのです。
2つ目は、架空経費の計上です。
これは、ありもしない経費を勝手に計上するということです。
そんなことをするわけがないだろうと言いながらも、実は、意外と罪の意識もなくされている架空経費の計上があります。
それは、パート従業員の給与が一定金額を超えると配偶者控除の対象になれないとの理由で、その子供などの名前を「借りて」給与を支給しているようなケースです。
実は、これも立派な「架空経費」の計上なのです。
これらの「売上除外」や「架空経費」は、思っている以上に罪の重いものです。
グレーゾーンでの解釈の相違であれば落とし所を探すことができますが、これらの「売上除外」「架空経費計上」は全くそのような余地はありません。
ペナルティも重い上、一つでも見つかるとその税務調査だけでなく以降の税務調査もかなり厳しくなるなどとても割りに合わないものなのです。
そして3つ目は、税務調査で税務署員に仕事をする気にさせるということです。
多くの税務署員は、別に適正な申告をさせたくて税務調査に来ているわけではありません。
それなのに、家族との海外旅行を経費に混ぜるようなことをしておきながら、見え見えの嘘をつき続けた上に、「やれるもんならやってみろ」「そんなに細かいことどうでもいいだろう」となどといって税務署員の正義感を刺激したり、「お前ら公務員に民間の仕事の何がわかるのだ」などといって個人的なコンプレックスを刺激するようなことを言って、相手に憎悪の気持ちを持たせることは避けたほうが良いでしょう。
通常であれば、税務署員も、公務員として淡々粛々と仕事をしたいだけなのに、そういうことをされれば、さすがに感情的になって必要以上に厳しい税務調査になることもあるのです。
税務調査では、当然、納税者と税務署の利害は対立します。
しかし、それは、取引先や仕入先との価格交渉でも同様であり、税務調査というのは利害が対立する社会人同士の普通の交渉事なのです。
そのような場面で、話をまとめるのに相手を罵倒して怒らせるようなことはしないでしょう。
ですから、別に税務署員に対してへりくだる必要など全くないですが、相手の立場に敬意を払いながらも、自らが有利になる条件をできるだけ引き出すようにすればよいのです。
ということで、今回は税務申告や税務調査では、売上除外と架空経費計上、そして税務署員に仕事をする気にさせるようなことはしないという話をしました。
ありがとうございました。(1651字)
指定した長さごとに生成型要約
元の文章を指定した文字数に区切ってそれぞれの文章を要約してくれます。区切る文字数は「200字」「500字」「800字」「1000字」です。
200字ごと
うーん、まあ言っていることはわからんではないですが、正しく要約されているとは言い難いです。
500字ごと
500字ごとに区切って要約も文意を正しく反映しているのかはよくわからないですが、ここが重要だとAIは判定しているのかなと言うことが伺えます。ちょっとこれ以上の要約は無理かな。
800字ごと
やっぱり要約しすぎですね。
すべての文字の長さを揃える
いわゆる箇条書きで文章の長さを揃えてくれる。「10字」「30字」「50字」が選択可能
50字を選んでみたが、これのどこが50字なんだ?よくわからん。
分量的には1000字程度に圧縮されているが、何を言っているのかわからん。
これは使えないです。
すべての文を圧縮する
文章全体を圧縮するようです。圧縮率は「高」「中」「低」
圧縮率「中」
お、これはそれなりに違和感なく読める。文意も大体あってます。
これで1006字なので、元の文章を6割強に要約しています。
これ以上圧縮率を高くしても文意がわからなくなりそうだし、これ以下の圧縮率だとやる意味もそんなにないでしょう。
重要な文を抽出する
重要だと思われる部分を抽出してくれると。圧縮率は「高」「中」「低」
圧縮率「中」
これも十分意味が通じます。圧縮率「中」だと実用的なのかもしれません。
あれ?これは「すべての文を圧縮する」と何が違うんだ?同じじゃん。
重要な文を抽出後圧縮して指定した長さにする
文字通りそういうことなのでしょう。圧縮率は「50字」「200字」「300字」「500字」「800字」「1000字」「1500字」
200字
何を言っているのかわからん。
500字
これも無理がある。何を言ってるのかわからないです。
800字
まだ、無理。常体と敬体、体言止めもよくわからんルールで混じっていて使える気がしない。
1000字
やっぱり6割位の圧縮率だとまあいい感じに圧縮できるのかもしれません。
って、これも「すべての文を圧縮する」と何が違うんだ?同じじゃん。
結局、1600字を1000字くらいにするものは、どの機能の同じだと言うことかなと。
今後の学習次第では実用レベルに
正直にいうと、まだそのまま要約した文章を使う気にはなれないレベルですが、今後学習が進んでいけばより利用価値の高いツールにはなりそうです。
紙の本や雑誌原稿の場合、文字数は厳格で、可能な限り無駄な接続詞は省く必要がありますが、ネットの文章はそのような制約がないため、読みやすさわかりやすさ重視でどんどん無駄な言葉が増えていきがちです。
緩んでしまった文章要約力を元に戻すためにも、こういうツールで自分の文章を一度確認してみると良いでしょう。
9割の人が間違えている「会社のお金」無料講座公開中
「生命保険なら積金より負担なく退職金の準備が可能」
「借金するより自己資金で投資をするほうが安全」
「人件費は売上高に関係なく発生する固定費」
「税務調査で何も指摘されないのが良い税理士」
すべて間違い。それじゃお金は残らない。
これ以上損をしたくないなら、正しい「お金の鉄則」を