R crawler

# Put all the decoration you have collected into the basket.
article_list = list()
for (i in seq_along(url_vec[1:5])){
  article_list[[i]] <- article_detail(url_vec[i])
}
article_list[[1]]

$author
[1] "killeryuan (龍鳥)"
 
$title
[1] "[好雷] 《永恆族》可惜不能是獨立電影"

$time
[1] "Sun Dec  5 20:28:07 2021"

$main_content
[1] "圖文好讀：https://vocus.cc/article/61a9d6f7fd89780001c9f5f7漫威電影宇宙甚麼都好，就可惜在每一部電影、每一個英雄都不能是獨立的，都必須為整體的主軸服務。這種趨勢在正式建立「宇宙」後被確立，在票房大獲成功後更成為「天條」，所以蜘蛛人必須成為鋼鐵人小弟，所以索爾和驚奇隊長必須離開地球，所以永恆族必須把三個故事塞在一集電影講完。~~~~~~~~~~~~~~~~~~~ 雷文 主文分隔線 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~沒錯，三個。首先是永恆族團隊在幾千年前來到地球，保護古代地球人與怪物戰鬥到近現代，這是第一個。數千年的戰鬥讓永恆族身心俱疲，地球人彼此戰爭的殘酷也讓部分成員對保護地球產生質疑，最後團隊四散，摸索著與地球人共存，這是第二個。最後則是永恆族的主宰天神族的真正計畫被揭露出來，包括永恆族的真正起源、怪物的真相、以及保護地球的真正意義，這導致團隊真正的內鬨、對彼此下殺手，但也在最後找到了「團結」的真諦，這是第三個。看看，這根本是把三集《美國隊長》搬在一起演：第一集是古代、第二集是團隊從內部瓦解，最後一集是彼此的內戰。從投入的場景預算、編劇對每個角色的描寫、動作場面的編排等各方面來看，製作方是很認真、很嚴肅的想把這電影「拍好」，幾乎每個永恆族都有自己專屬的故事線，也盡可能在有限的鏡頭和時間中詮釋出各自的性格特色。前後情節也都能做到互相呼應，至少不會像《蜘蛛人２：電光之戰》一樣幾條劇情線完全沒有交集。而永恆族的選角方面，上映前有不少人抱怨太過「政治正確」，選了許多非白人演員，或是讓角色成為聾啞人與同性戀等。撇開政治議題不談，這些演員其實都是老面孔，常常出沒在美劇或是電影中，演技是有保證的。至少不會像恐怖電影一樣黑人只負責死，又或是讓角色莫名其妙開始發表政確演講。但盡管電影長度已經相當長了（這又不是DC），但時間還是不夠。聾啞女英雄雖然能夠很自然地融入在每個場景中，但屬於她的故事基本沒有，觀眾無從瞭解她。黑人同性戀英雄似乎只是為了帶出「因為愛而重拾對人類的信心」的題材，但這似乎不是同性戀也可以吧？最倒楣就是女主角，因為劇情濃度太高，她必須是一個專門推動主線的角色，因此變成像是許多手遊主角一樣，幾乎毫無個人特色，只是為了推動劇情或是介紹設定而動作。明明台詞是最多的，但記憶點卻最少，就連能力都像是為了最後大戰而硬湊出來的。正因為能看得出來製作團隊對電影的認真對待，對於最終的成果只能說可惜，可惜最後只能交出一部普通偏上的漫威電影：有大場面、有香豔場景、有幽默笑料、帶出下一部電影的鋪陳，然後就沒了。不過，對於賦予它的期望和為了達成期望而付出的努力，還是必須給予肯定的，最終成果畢竟仍然是一部相當有娛樂性的動作大片。實在非戰之罪，任何一個三部曲給壓縮在一部電影裡面最多就只能這樣了。總分：3.5/5劇情：3/5角色：3/5動作：4/5特效：4/5"

$push
[1] "→" "→" "推" "→" "噓" "推" "→"

$push_id
[1] "StarLeauge" "will0620"   "AppleAlice" "AppleAlice" "butmyass"  
[6] "odddriver"  "f126975955"

$push_content
[1] "目前來看他就是獨立電影，暫和MCU沒任何的連結"     
[2] "可惜不能是影集"                                  
[3] "很推這個觀點，我也覺得這部很好看，但要探討的議題"
[4] "很多，濃度太高，變得很不好處理"                  
[5] "儘管"                                            
[6] "希望拍成影集"                                    
[7] "他不是獨立電影啊片尾還是跟MCU連在一起了"         

$push_time
[1] "12/05 20:54" "12/05 21:09" "12/05 21:30" "12/05 21:30" "12/05 22:33"
[6] "12/05 23:19" "12/06 12:25"

網路爬蟲

資料 data

巧婦難為無米之炊

今天可以學到什麼？

認識JSON檔

所以到底什麼是JSON檔?

JSON檔長什麼樣子？

JSON as array

認識網頁基本架構

html+CSS, maybe Javascript?

先祝大家聖誕快樂

說到聖誕節，大家想到什麼？

沒概念？

來看看實際上長什麼樣子

爬蟲基本概念

既然網頁是聖誕樹...

那爬蟲就是...找裝飾品！

寫成程式會變怎樣呢

`readLines()`

如果你要爬的網頁結構相對簡單`readLines()`是相對好的選擇

為什麼?

Guideline:

第一次爬行

我們發現了什麼?

`rvest()`

怎麼找CSS或XPath呢？

一般情形

請先下載擴充程式

特殊情形

Abe Hiroshi's Official Website

範例一

PTT 爬蟲

範例二

PCHome 爬蟲

你發現了什麼？

找不到資料

網路爬蟲

資料 data

巧婦難為無米之炊

今天可以學到什麼？

認識JSON檔

所以到底什麼是JSON檔?

JSON檔長什麼樣子？

JSON as array

認識網頁基本架構

html+CSS, maybe Javascript?

先祝大家聖誕快樂

說到聖誕節，大家想到什麼？

沒概念？

來看看實際上長什麼樣子

爬蟲基本概念

既然網頁是聖誕樹...

那爬蟲就是...找裝飾品！

寫成程式會變怎樣呢

readLines()

如果你要爬的網頁結構相對簡單readLines()是相對好的選擇

為什麼?

Guideline:

第一次爬行

我們發現了什麼?

rvest()

怎麼找CSS或XPath呢？

一般情形

請先下載擴充程式

特殊情形

Abe Hiroshi's Official Website

範例一

PTT 爬蟲

範例二

PCHome 爬蟲

你發現了什麼？

找不到資料

`readLines()`

如果你要爬的網頁結構相對簡單`readLines()`是相對好的選擇

`rvest()`