まず、フォーマットするデータの種類の小さな例については、この URLを参照してください。選択しようとしているワークシートの 2 つの領域を強調表示していることに気付くでしょう。プロジェクトがデータセットに出入りするため、選択範囲は動的である必要があります。最初の部分については、次のコードで十分だと思います。
library(tidyverse)
library(readxl)
filename <- "MyDataset.xlsx"
#obtain first section of my excel spreadsheet
project_codes <- read_excel(
path = filename,
sheet = "Jan18",
range = "A10:B1000",
col_names = c("proj_num", "name")
) %>%
drop_na() %>%
filter(grepl("-", project_codes$proj_num))
2 番目のセクションでつまずきます...スプレッドシートの強調表示された他の領域で、'project_codes' とまったく同じ行のサブセットを選択したことを確認したいと思います。
これとまったく同じ方法でフォーマットされた多くのワークシートがあります (そして命名規則は一貫しています - Jan18、Feb18、Mar18) ので、誰かがパート 1 を解決した後にワークシートを反復処理するのを手伝ってくれればボーナス ポイントです。