<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>NLP on Saiga</title>
    <link>http://localhost:1313/tags/nlp/</link>
    <description>Recent content in NLP on Saiga</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <managingEditor>wuwenzen@outlook.com (wuwj)</managingEditor>
    <webMaster>wuwenzen@outlook.com (wuwj)</webMaster>
    <lastBuildDate>Sun, 05 Dec 2021 00:00:00 +0000</lastBuildDate>
    <atom:link href="http://localhost:1313/tags/nlp/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>用云端 NLP API 做一个简单的文本分析工具</title>
      <link>http://localhost:1313/posts/2021-12-05-first-ai-touch/</link>
      <pubDate>Sun, 05 Dec 2021 00:00:00 +0000</pubDate><author>wuwenzen@outlook.com (wuwj)</author>
      <guid>http://localhost:1313/posts/2021-12-05-first-ai-touch/</guid>
      <description>&lt;p&gt;很早之前就对「AI 能不能帮忙看评论、看工单」这件事好奇过，但自己训模型门槛挺高，于是先选了条&lt;strong&gt;最省事的路&lt;/strong&gt;：&lt;/p&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;找一个云厂商提供的 NLP API，用 HTTP 请求的方式做一层简单封装，做一个「文本分析小工具」。&lt;/p&gt;&#xA;&lt;/blockquote&gt;&#xA;&lt;p&gt;这篇文章记录的是那次尝试的过程。&lt;/p&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;注：下面不强调具体厂商名字，主线思路在于「怎么用」，而不是「用谁」。&lt;/p&gt;&#xA;&lt;/blockquote&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;1-想做一个什么样的小工具&#34;&gt;1. 想做一个什么样的小工具？&lt;/h2&gt;&#xA;&lt;p&gt;需求非常朴素：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;输入一段文本（比如用户评论、客服工单）；&lt;/li&gt;&#xA;&lt;li&gt;自动判断它是「正向 / 负向 / 中性」；&lt;/li&gt;&#xA;&lt;li&gt;选做：给出一个大致类别，比如「产品问题 / 物流问题 / 售后问题」。&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;最终希望变成一个简单的 Web 页面：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;左边输入框；&lt;/li&gt;&#xA;&lt;li&gt;右边展示：情感结果、类别标签、关键句/关键词。&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;2-挑选一个云-nlp-服务&#34;&gt;2. 挑选一个云 NLP 服务&lt;/h2&gt;&#xA;&lt;p&gt;大部分云厂商都会提供类似能力：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;情感分析（Sentiment Analysis）；&lt;/li&gt;&#xA;&lt;li&gt;文本分类（Text Classification）；&lt;/li&gt;&#xA;&lt;li&gt;关键词提取、实体识别等。&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;通常接入步骤类似：&lt;/p&gt;&#xA;&lt;ol&gt;&#xA;&lt;li&gt;注册账号；&lt;/li&gt;&#xA;&lt;li&gt;在控制台创建一个 NLP 应用 / 项目；&lt;/li&gt;&#xA;&lt;li&gt;拿到 API Key / Secret / Endpoint；&lt;/li&gt;&#xA;&lt;li&gt;看一眼文档里示例请求。&lt;/li&gt;&#xA;&lt;/ol&gt;&#xA;&lt;p&gt;示例请求（伪代码）：&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;&#34;&gt;&lt;code class=&#34;language-http&#34; data-lang=&#34;http&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#960050;background-color:#1e0010&#34;&gt;POST /nlp/sentiment&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#960050;background-color:#1e0010&#34;&gt;Authorization: Bearer &amp;lt;API_KEY&amp;gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#960050;background-color:#1e0010&#34;&gt;Content-Type: application/json&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#960050;background-color:#1e0010&#34;&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#960050;background-color:#1e0010&#34;&gt;{&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#960050;background-color:#1e0010&#34;&gt;  &amp;#34;text&amp;#34;: &amp;#34;这次发货太慢了，等了一个星期才收到。&amp;#34;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#960050;background-color:#1e0010&#34;&gt;}&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;响应大概会是：&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;&#34;&gt;&lt;code class=&#34;language-json&#34; data-lang=&#34;json&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;{&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;  &lt;span style=&#34;color:#f92672&#34;&gt;&amp;#34;sentiment&amp;#34;&lt;/span&gt;: &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;negative&amp;#34;&lt;/span&gt;,&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;  &lt;span style=&#34;color:#f92672&#34;&gt;&amp;#34;confidence&amp;#34;&lt;/span&gt;: &lt;span style=&#34;color:#ae81ff&#34;&gt;0.94&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;}&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;或者更细一些：&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
