[解決済み] Apple(Inc.)に関するツイートとリンゴ(果物)に関するツイートを区別するモデルはどのように構築できますか?
2023-05-09 17:03:53
質問
apple.quot;に関する50のツイートは以下をご覧ください。それらは以下のように1としてマークされています。
ここにいくつかの行があります。
1|“@chrisgilmer: Apple targets big business with new iOS 7 features http://bit.ly/15F9JeF ”. Finally.. A corp iTunes account!
0|“@Zach_Paull: When did green skittles change from lime to green apple? #notafan” @Skittles
1|@dtfcdvEric: @MaroneyFan11 apple inc is searching for people to help and tryout all their upcoming tablet within our own net page No.
0|@STFUTimothy have you tried apple pie shine?
1|#SuryaRay #India Microsoft to bring Xbox and PC games to Apple, Android phones: Report: Microsoft Corp... http://dlvr.it/3YvbQx @SuryaRay
これが全データセットです。 http://pastebin.com/eJuEb4eB
私は、"Apple" (Inc.)とそれ以外を分類するモデルを構築する必要があります。
私は機械学習の一般的な概要を求めているのではなく、むしろコードで実際のモデルを探しています ( Python が望ましい)。
どのように解決するのですか?
私なら次のようにします。
- 文章を単語に分割し、正規化し、辞書を構築します。
- 各単語について、会社に関するツイートで何回出現したか、果物に関するツイートで何回出現したかを保存する - これらのツイートは人間によって確認する必要がある
- 新しいツイートが来たら、ツイートの中のすべての単語を辞書で探し、加重スコアを計算する - 会社に関連して頻繁に使用される単語は、会社のスコアが高くなり、その逆も同様である - ほとんど使われない単語や、会社とフルーツの両方で使われる単語は、あまりスコアを持たない。
関連
-
[解決済み] Pythonの辞書からキーを削除するにはどうしたらいいですか?
-
[解決済み] リストからランダムに項目を選択するにはどうすればよいですか?
-
[解決済み] ローカルディレクトリからrequirements.txtファイルに従ってpipを使用してパッケージをインストールするにはどうすればよいですか?
-
[解決済み] IntelliJからjarを正しくビルドする方法は?
-
[解決済み] 64ビットJVMで動作しているか、32ビットJVMで動作しているか、どうすればわかりますか(プログラム内から)?
-
[解決済み] Flaskを使用してURLから名前付きパラメータを取得するにはどうすればよいですか?
-
[解決済み] dictから値のリストを取得するにはどうすればよいですか?
-
[解決済み] Javaを使ってインターネットからファイルをダウンロードし、保存するにはどうすればよいのでしょうか?
-
[解決済み】リストから要素を削除するにはどうすればいいですか?
-
[解決済み】Rでワークスペースから1つ以外のオブジェクトを削除するにはどうすればいいですか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
Eclipseは、ポップアップA Java Exception has occurred.を実行し、エラーException in threadの解決策を報告します。
-
NullPointerException - java.lang.
-
ApplicationContextの起動エラーです。条件レポートを表示するには、アプリケーションを'de'で再実行します。
-
セミコロン期待値エラー解決
-
FindBugの使用概要
-
Javaがテキストファイルを読み込む
-
XXX型を囲むインスタンスがJavaでアクセスできない
-
eclipse にリソースリーク:'in' が閉じない
-
eclipse 実行 Java、エラー: 選択を起動できず、レシーバーもありません。
-
Java Runtime Environmentを継続するためのメモリが不足しています。