[解決済み] Rを使ってテキストから句読点を削除する
2022-01-29 20:58:17
質問
テキストから句読点を削除したいのですが、どうすればよいですか?私はtmパッケージを使用していますが、キャッチがあります。
例:テキストはこのようなものです。
data <- "I am a, new comer","to r,"please help","me:out","here"
を実行すると
library(tm)
data<-removePunctuation(data)
私のコードでは、結果は:
I am a new comerto rplease helpmeouthere
が、私が期待するのは
I am a new comer to r please help me out here
解決方法は?
以下は、あなたの質問の受け止め方と、上のコメントにある @David Arenburg の答えに非常に近いものです。
data <- '"I am a, new comer","to r,"please help","me:out","here"'
gsub('[[:punct:] ]+',' ',data)
[1] " I am a new comer to r please help me out here "
punct:]の後の余分なスペースは、文字列にスペースを追加するためで、+は正規表現の1つまたは複数の連続した項目にマッチします。これは、場合によっては望ましい副次的効果として、連続した空白を一つの空白に短縮することができます。
関連
-
[解決済み】エラー:私のコードで予期しないシンボル/入力/文字列定数/数値定数/SPECIALが発生した
-
[解決済み】Rのメモリ管理/サイズn Mbのベクトルを割り当てられない
-
[解決済み】R ggplot2 で scale_x_discrete を使用する。
-
[解決済み】forループを実行すると「要因のレベルセットが異なる」というエラーが発生する
-
[解決済み】Rで相対的な頻度をプロットするためにhistをどのように使用しますか?
-
[解決済み] 関数のソースコードを見るにはどうしたらいいですか?
-
[解決済み] Rでロードされているパッケージのバージョンを調べるには?
-
[解決済み] なぜ `[`] は `subset` よりも優れているのですか?
-
[解決済み] ggplotで凡例のタイトルを変更する方法
-
[解決済み】data.table vs dplyr:一方がうまくできない、またはうまくできないことを行うことができますか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】xtsオブジェクトでエラー: "antempt to set 'colnames' on the object with less than two dimension "を克服する方法
-
[解決済み】エラー。Rの次元数が正しくない
-
[解決済み】添え字付き代入でNAを使用することはできません
-
[解決済み】Rで「パッケージ'FILE_PATH'のインストールで終了ステータスが0でなかった」。
-
[解決済み】値を置き換えようとすると、"データフレームの添え字の割り当てで欠損値は許可されない"
-
[解決済み】reshape2 meltの警告メッセージ
-
[解決済み】bstTreeの予測値の混乱行列、エラー:'The data must contain some levels that overlap reference'.
-
[解決済み】Rでデータフレームのサブセットをプロットする方法は?
-
[解決済み】.External.graphics Rでエラーが発生しました。
-
[解決済み】dplyr: "Error in n(): 関数は直接呼ばれるべきではありません"